SEO的潜在语义索引? 您的内容优化值得更好
已发表: 2019-04-17你还记得《黑客帝国》中墨菲斯(劳伦斯·菲什伯恩饰)在他的每只手掌上都拿出一个胶囊,描述尼奥(基努·里维斯饰)面临的选择的场景吗?
他说:“这是你最后的机会。 在这之后,就没有回头路了。 你吃了蓝色药丸——故事结束了,你在床上醒来,相信任何你想相信的东西。 你服用红色药丸——你留在仙境,我告诉你兔子洞有多深。 请记住:我所提供的只是真相。 而已。”
这篇博文——有点像。 在这种情况下,我们将讨论潜在语义索引,具体来说:
- 这是什么
- 为什么它在 SEO 人群中如此受欢迎
- 如果谷歌使用它
- 是否有助于您的 SEO 工作
最后,就像 Neo 一样,你可以选择相信任何你想要的东西。 那么,让我们开始吧。 (排队悬疑主题音乐)

什么是潜在语义索引 (LSI)?
在 SEO 领域,潜在语义索引 (LSI) 和潜在语义分析 (LSA) 是可互换的术语。 我们不会因为它们的差异而分道扬镳,所以我们将在这篇博文中遵循相同的做法。
LSI 是一种分析一组文档和其中包含的术语之间关系的技术。 有一个基本假设,即意义相近的单词将出现在相似的文本中(称为分布假设)。 它依靠一种称为奇异值分解的数学技术来识别这些关系。
对于那些感兴趣的人,这里有一个很棒的潜在语义索引示例 (pdf),您可以参考。
如果数学不是你的事,请不要担心。 您无需了解该过程的技术细微差别。
需要了解的重要一点是,创建 LSI 是为了索引不经常更新的文档集合的内容。
为什么这很重要? 我们稍后再谈。
首先,让我们尝试了解 LSI 是如何在 SEO 领域变得如此重要的。
LSI 关键字及其在 SEO 专家中的流行度
似乎搜索引擎优化的世界经历了特定策略变得流行的阶段。 有一次它是关键字填充,一种在博客文章中重复某些短语的做法,令人作呕。 诚然,它并没有改善内容。 但它一直有效,直到搜索引擎抓住了这个策略。
页面搜索引擎优化的下一个“进步”与关键字密度有关。 每个 SEO 专家都没有不分青红皂白地填充关键字,而是就可以在一篇文章中塞入多少关键字词组而不会被抓到,提出了他们的意见。
事后看来,你不禁嘲笑这一切的徒劳。 但这在当时是一件严肃的事情。 令人惊讶的是,这种绝对无用的 SEO 策略继续吸引人们的兴趣!
这是我想警告您的另一种 SEO 技术。
有 SEO 专家声称 Google 使用了某种形式的 LSI 技术。 虽然我不确定是谁开始了这个相当于都市传奇的 SEO,但有一件事是肯定的。 很多人都把它当作事实来谈论。

我想这并不奇怪。 当一些著名的 SEO 行业影响者霸占该术语并开始声称 LSI 优化如何帮助推动自然流量时,这群人肯定会效仿。
从表面上看,LSI 导致 SEO 成功的想法似乎是合理的。 我们知道谷歌对语义感兴趣——理解自然语言并掌握页面上单词背后的隐藏含义。 在这里,他们说了很多。
另外,如果您是一家 SEO 公司,试图以高价出售普通的 SEO 服务,那么使用潜在语义索引等术语和短语会让您听起来很聪明(而且价格昂贵)。
此外,一般的数字营销团队要了解多少主题建模算法? 可能介于零和一之间。
此外,潜在语义索引听起来比词频-逆文档频率 (TF-IDF) 或潜在狄利克雷分配 (LDA) 更性感。
问题仍然存在。
搜索引擎是否使用潜在语义索引?
虽然无法证明,但谷歌不太可能使用 LSI。 我知道,总会有人不相信——就像有人相信地球是平的,美国从未登上月球,猫王还活着。
虽然我们知道谷歌对文本进行语义分析,但不能得出结论,因此他们使用潜在语义分析。 这一断言是逻辑上的重大飞跃。
这是另一个问题。
LSI 技术的一个主要挑战是可扩展性和性能问题。 这种自然语言处理的早期尝试旨在处理相对较小的静态文档集。 它从来没有像我们在 Web 上那样处理大量不断变化的内容。 事实上,潜在语义分析的专利是在 1988 年申请的,比网络上线早了近三年。
更不用说使用潜在语义分析有一些缺点:
- 该模型难以处理多义词(一个词的多重含义)。 例如,起重机可以是一块建筑或一只长颈鸟。
- 它忽略了词序,从而错过了句法关系、逻辑和形态。
- 它假设文档中术语的特定分布(高斯分布)可能并非在所有情况下都是正确的。
- 它是计算密集型的,并且难以用新数据持续更新。
这里还有一点需要考虑。 谷歌在 2017 年获得了一项词向量方法 (pdf) 的专利,该方法能够处理数十亿个词的语料库和数百万个词汇。 这正是您在分析网络内容时需要的那种火力!
可以肯定地说,谷歌用于索引网络内容的技术和理解内容自早期以来已经取得了长足的进步。

LSI 是搜索引擎的训练轮。
罗杰·蒙蒂
搜索引擎期刊
当您不仅可以使用更好而且更快的东西时,为什么还要使用旧技术?
您的搜索引擎优化工作能否从潜在语义分析中受益?
并不真地。 首先,我们会看看为什么会这样,然后我们会看看更好的方法。
您可能遇到过提供免费“LSI 关键字”的网站。 不幸的是,他们没有提供如何使用 LSI 生成结果的任何信息。 据我所见,输出的质量并不是那么好。 他们提供的不一定是相关的主题,因为它们是变体。

还有一个问题需要考虑。
当涉及到潜在语义索引和 SEO 时,我所看到的建议基本上可以归结为使用其中一些 LSI 关键字“散布”您的内容,这些关键字实际上只是同义词。 该建议背后的基本原理是,使用这些同义词可以增强您内容的主题相关性。 这对搜索引擎优化一定有好处,对吧?
没那么快。
这个关于换词的事情闻起来很像关键字填充/密度兔子洞,许多 SEO 不久前冒险下来。
如前所述,没有证据表明我们可以得出 Google 使用 LSI 的结论。 事实上,搜索引擎在用于理解网页和建立语义相关性的技术方面肯定领先数年。
所以,别再依赖80年代的技术了。 不要成为不会放弃 Betamax VCR 的人。
改为这样做。
- 停止寻找让 Google 认为您的内容比实际内容更好的方法。
- 专注于您的受众并创造出色的内容。
- 使用更好的主题建模平台(试试 MarketMuse)。
- 使用其研究应用程序来导出语义相关主题的列表。 只需输入一个主题(通常是搜索查询),您就会得到一个按相关性排序的 50 个相关主题的列表。
- 仔细检查该列表以确定该主题背后的故事。 使用捕捉主题本质的子标题来构建博客文章。

- 填写每个部分的详细信息,解决所有相关概念并添加上下文。
- 使用问题应用程序有助于更好地了解您所定位的搜索词背后的用户意图。
- 对您的页面优化工作有新的看法。 MarketMuse 的优化应用程序表明您对该主题的了解程度。 立即获得有关您的写作的反馈,以确定您是否已达到目标内容分数和字数。 在您点击发布按钮之前,您就会知道您的内容的潜力。
您的 SEO 策略不应该在 1980 年的技术上运行,除非您是喜欢使用运行 MS-DOS 的 IBM-XT 的类型。 我该说谁? 几年后,我们可能都会嘲笑 LSI,就像我们嘲笑关键字密度一样。
你现在应该做什么
当您准备就绪时……我们可以通过以下 3 种方式帮助您更快地发布更好的内容:
- 与 MarketMuse 预约时间 与我们的一位策略师安排现场演示,了解 MarketMuse 如何帮助您的团队实现其内容目标。
- 如果您想了解如何更快地创建更好的内容,请访问我们的博客。 它充满了帮助扩展内容的资源。
- 如果您认识其他喜欢阅读此页面的营销人员,请通过电子邮件、LinkedIn、Twitter 或 Facebook 与他们分享。
