SEO的潛在語義索引? 您的內容優化值得更好
已發表: 2019-04-17你還記得《黑客帝國》中墨菲斯(勞倫斯·菲什伯恩飾)在他的每隻手掌上都拿出一個膠囊,描述尼奧(基努·里維斯飾)面臨的選擇的場景嗎?
他說:“這是你最後的機會。 在這之後,就沒有回頭路了。 你吃了藍色藥丸——故事結束了,你在床上醒來,相信任何你想相信的東西。 你服用紅色藥丸——你留在仙境,我告訴你兔子洞有多深。 請記住:我所提供的只是真相。 而已。”
這篇博文——有點像。 在這種情況下,我們將討論潛在語義索引,具體來說:
- 這是什麼
- 為什麼它在 SEO 人群中如此受歡迎
- 如果谷歌使用它
- 是否有助於您的 SEO 工作
最後,就像 Neo 一樣,你可以選擇相信任何你想要的東西。 那麼,讓我們開始吧。 (排隊懸疑主題音樂)

什麼是潛在語義索引 (LSI)?
在 SEO 領域,潛在語義索引 (LSI) 和潛在語義分析 (LSA) 是可互換的術語。 我們不會因為它們的差異而分道揚鑣,所以我們將在這篇博文中遵循相同的做法。
LSI 是一種分析一組文檔和其中包含的術語之間關係的技術。 有一個基本假設,即意義相近的單詞將出現在相似的文本中(稱為分佈假設)。 它依靠一種稱為奇異值分解的數學技術來識別這些關係。
對於那些感興趣的人,這裡有一個很棒的潛在語義索引示例 (pdf),您可以參考。
如果數學不是你的事,請不要擔心。 您無需了解該過程的技術細微差別。
需要了解的重要一點是,創建 LSI 是為了索引不經常更新的文檔集合的內容。
為什麼這很重要? 我們稍後再談。
首先,讓我們嘗試了解 LSI 是如何在 SEO 領域變得如此重要的。
LSI 關鍵字及其在 SEO 專家中的流行度
似乎搜索引擎優化的世界經歷了特定策略變得流行的階段。 有一次它是關鍵字填充,一種在博客文章中重複某些短語的做法,令人作嘔。 誠然,它並沒有改善內容。 但它一直有效,直到搜索引擎抓住了這個策略。
頁面搜索引擎優化的下一個“進步”與關鍵字密度有關。 每個 SEO 專家都沒有不分青紅皂白地填充關鍵字,而是就可以在一篇文章中塞入多少關鍵字詞組而不會被抓住的問題提出意見。
事後看來,你不禁嘲笑這一切的徒勞。 但這在當時是一件嚴肅的事情。 令人驚訝的是,這種絕對無用的 SEO 策略繼續吸引人們的興趣!
這是我想警告您的另一種 SEO 技術。
有 SEO 專家聲稱 Google 使用了某種形式的 LSI 技術。 雖然我不確定是誰開始了這個相當於都市傳奇的 SEO,但有一件事是肯定的。 很多人都把它當作事實來談論。

我想這並不奇怪。 當一些著名的 SEO 行業影響者霸占該術語並開始聲稱 LSI 優化如何幫助推動自然流量時,這群人肯定會效仿。
從表面上看,LSI 導致 SEO 成功的想法似乎是合理的。 我們知道谷歌對語義感興趣——理解自然語言並掌握頁面上單詞背後的隱藏含義。 在這裡,他們說了很多。
另外,如果您是一家 SEO 公司,試圖以高價出售普通的 SEO 服務,那麼使用潛在語義索引等術語和短語會讓您聽起來很聰明(而且價格昂貴)。
此外,一般的數字營銷團隊要了解多少主題建模算法? 可能介於零和一之間。
此外,潛在語義索引聽起來比詞頻-逆文檔頻率 (TF-IDF) 或潛在狄利克雷分配 (LDA) 更性感。
問題仍然存在。
搜索引擎是否使用潛在語義索引?
雖然無法證明,但谷歌不太可能使用 LSI。 我知道,總會有人不相信——就像有人相信地球是平的,美國從未登上月球,貓王還活著。
雖然我們知道谷歌對文本進行語義分析,但不能得出結論,因此他們使用潛在語義分析。 這一斷言是邏輯上的重大飛躍。
這是另一個問題。
LSI 技術的一個主要挑戰是可擴展性和性能問題。 這種自然語言處理的早期嘗試旨在處理相對較小的靜態文檔集。 它從來沒有像我們在 Web 上那樣處理大量不斷變化的內容。 事實上,潛在語義分析的專利是在 1988 年申請的,比網絡上線早了近三年。
更不用說使用潛在語義分析有一些缺點:
- 該模型難以處理多義詞(一個詞的多重含義)。 例如,起重機可以是一塊建築或一隻長頸鳥。
- 它忽略了詞序,從而錯過了句法關係、邏輯和形態。
- 它假設文檔中術語的特定分佈(高斯分佈)可能並非在所有情況下都是正確的。
- 它是計算密集型的,並且難以用新數據持續更新。
這裡還有一點需要考慮。 谷歌在 2017 年獲得了一項詞向量方法 (pdf) 的專利,該方法能夠處理數十億個詞的語料庫和數百萬個詞彙。 這正是您在分析網絡內容時需要的那種火力!
可以肯定地說,谷歌用於索引網絡內容的技術和理解內容自早期以來已經取得了長足的進步。

LSI 是搜索引擎的訓練輪。
羅傑·蒙蒂
搜索引擎雜誌
當您不僅可以使用更好而且更快的東西時,為什麼還要使用舊技術?
您的搜索引擎優化工作能否從潛在語義分析中受益?
並不真地。 首先,我們會看看為什麼會這樣,然後我們會看看更好的方法。
您可能遇到過提供免費“LSI 關鍵字”的網站。 不幸的是,他們沒有提供如何使用 LSI 生成結果的任何信息。 據我所見,輸出的質量並不是那麼好。 他們提供的不一定是相關的主題,因為它們是變體。

還有一個問題需要考慮。
當涉及到潛在語義索引和 SEO 時,我所看到的建議基本上可以歸結為使用其中一些 LSI 關鍵字“散佈”您的內容,這些關鍵字實際上只是同義詞。 該建議背後的基本原理是,使用這些同義詞可以增強您內容的主題相關性。 這對搜索引擎優化一定有好處,對吧?
沒那麼快。
這個關於換詞的事情聞起來很像關鍵字填充/密度兔子洞,許多 SEO 不久前冒險下來。
如前所述,沒有證據表明我們可以得出 Google 使用 LSI 的結論。 事實上,搜索引擎在用於理解網頁和建立語義相關性的技術方面肯定領先數年。
所以,別再依賴80年代的技術了。 不要成為不會放棄 Betamax VCR 的人。
改為這樣做。
- 停止尋找讓 Google 認為您的內容比實際內容更好的方法。
- 專注於您的受眾並創造出色的內容。
- 使用更好的主題建模平台(試試 MarketMuse)。
- 使用其研究應用程序來導出語義相關主題的列表。 只需輸入一個主題(通常是搜索查詢),您就會得到一個按相關性排序的 50 個相關主題的列表。
- 仔細檢查該列表以確定該主題背後的故事。 使用捕捉主題本質的子標題來構建博客文章。

- 填寫每個部分的詳細信息,解決所有相關概念並添加上下文。
- 使用問題應用程序有助於更好地了解您所定位的搜索詞背後的用戶意圖。
- 對您的頁面優化工作有新的看法。 MarketMuse 的優化應用程序表明您對該主題的了解程度。 立即獲得有關您的寫作的反饋,以確定您是否已達到目標內容分數和字數。 在您點擊發布按鈕之前,您就會知道您的內容的潛力。
您的 SEO 策略不應該在 1980 年的技術上運行,除非您是喜歡使用運行 MS-DOS 的 IBM-XT 的類型。 我該說誰? 幾年後,我們可能都會嘲笑 LSI,就像我們嘲笑關鍵字密度一樣。
你現在應該做什麼
當您準備就緒時……我們可以通過以下 3 種方式幫助您更快地發布更好的內容:
- 與 MarketMuse 預約時間 與我們的一位策略師安排現場演示,了解 MarketMuse 如何幫助您的團隊實現其內容目標。
- 如果您想了解如何更快地創建更好的內容,請訪問我們的博客。 它充滿了幫助擴展內容的資源。
- 如果您認識其他喜歡閱讀此頁面的營銷人員,請通過電子郵件、LinkedIn、Twitter 或 Facebook 與他們分享。
