什麼是抓取預算以及如何針對 SEO 對其進行優化?

已發表: 2023-06-14

在 FATJOE,我們致力於為網頁創建高質量的內容並確保指向這些頁面的強大鍊接。

但是像谷歌這樣的搜索引擎是如何找到這些頁面的呢? 答案是爬行。

Google 抓取工具訪問網站、跟踪鏈接並分析每個頁面上的內容以將 URL 添加到其索引中。

抓取預算是搜索引擎在特定時間範圍內分配給抓取網頁的資源。 它決定了機器人將抓取您網站上的多少頁面以及它們返回的頻率。

管理抓取預算對於網站所有者和 SEO 團隊來說非常重要,尤其是那些擁有大型網站的團隊。

通過優化抓取預算,您可以確保搜索引擎將您網站的重要頁面編入索引。 這可以提高您在搜索結果中的可見度,並有助於確保搜索引擎看到您的內容。

在本指南中,我們將介紹:

  • 什麼是抓取預算
  • 怎麼運行的
  • 為什麼它對 SEO 很重要
  • 如何增加抓取預算
內容展示
什麼是抓取預算?
為什麼搜索引擎分配抓取預算?
Google 爬蟲有哪些不同類型?
移動優先爬行
Google 如何分配抓取預算?
抓取容量限制
抓取需求
抓取預算只包括網頁嗎?
抓取限制如何工作?
抓取需求如何運作?
為什麼抓取預算對 SEO 很重要?
在搜索結果中的可見性
網站結構
專題權威
關鍵字蠶食
您如何優化 SEO 的抓取預算?
策略 1:查看您的服務器日誌和抓取統計報告
策略 2:增加抓取預算
定期發布新鮮優質內容
改善頁面加載時間
確保移動友好性
策略三:網站維護:減少錯誤
策略 4:阻止爬蟲訪問您網站的某些部分
策略 5:減少重定向鏈
策略 6:獲得更多的內部和外部鏈接
充分利用您網站的抓取預算

什麼是抓取預算?

抓取預算是搜索引擎為網站抓取和索引其網頁提供的資源。

這在搜索引擎優化 (SEO) 中很重要,因為它決定了 Google 和其他搜索引擎如何有效地找到您的網頁並將其包含在搜索結果中。

為什麼搜索引擎分配抓取預算?

Google 有自己的名為 GoogleBot 的爬蟲,它可以探索和索引網頁。

但是互聯網是巨大的。

Google 無法抓取每個網站上的每個頁面並將其編入索引。

因此,為了確保它到達與搜索用戶最相關的頁面,Google 為網站分配了抓取預算。

非谷歌搜索引擎也是如此,但我們將專注於谷歌,因為它是谷歌。

Google 爬蟲有哪些不同類型?

搜索引擎有不同類型的爬蟲來收集有關網頁的信息。 我們在這裡總結了爬蟲和提取器的主要類型:

谷歌機器人

這是 Google 用於發現和索引網頁的主要爬蟲。 它會查看所有 HTML 內容、跟踪鏈接並分析網頁內容。

特例爬蟲

這些爬蟲用於特定任務,例如收集可訪問性信息。 特殊情況的爬蟲可能會或可能不會遵守 robots.txt 規則。

用戶觸發的提取器

當最終用戶觸發提取時使用這種類型的爬蟲。 例如,某些 Google Search Console 工具會根據用戶操作發送提取請求。 用戶觸發的提取器通常會忽略 robots.txt 規則。

谷歌新聞抓取工具

這個專注於抓取與新聞相關的內容。 它收集最新的新聞信息並確保它出現在谷歌的搜索結果和谷歌新聞平台中。

谷歌圖像抓取工具

顧名思義,這個爬蟲是關於圖像的。 它會搜索網絡以查找圖像並分析替代文本、標題和文件名等內容以了解上下文。

谷歌視頻抓取工具

類似於圖像爬蟲,這個爬蟲專門用於發現和索引視頻內容。 它查看視頻元數據、字幕和其他信息。

如需更全面地了解每個 Google 抓取工具和抓取工具(包括用戶代理令牌和用例),請跳到最後查看我們有用的表格!

移動優先爬行

由於越來越多的人使用移動設備瀏覽互聯網,谷歌已轉向移動優先索引。

谷歌使用智能手機代理在桌面版之前抓取和索引網站的移動版。 確保您的網站具有移動響應能力對於網站的可抓取性和優化抓取預算至關重要。

該搜索引擎最近於 2023 年 5 月完成了向移動優先索引的最終批量切換:

Google 如何分配抓取預算?

抓取預算基於兩個因素:抓取容量限制和抓取需求。

抓取容量限制

搜索引擎監控網站服務器的性能及其響應速度。 他們根據服務器的性能調整爬網容量限制。

該限制還受任何給定時間可用的爬網資源和網站所有者的偏好的影響。

您可以從 Google Search Console 的“抓取速度設置”頁面手動調整抓取速度限制。

如果您遇到可用性問題,可以降低抓取頻率。

但是手動增加它不會讓 Google 更快地抓取您的網站。您也無法影響 Google 將抓取哪些頁面。

抓取需求

抓取需求幫助搜索引擎決定更頻繁地抓取哪些頁面。

它會考慮網站大小、頁面更新頻率和感知頁面價值等因素。

SEO 技術問題也會影響抓取需求。

抓取預算只包括網頁嗎?

不,抓取預算不僅僅與頁面有關。

我們實際上是在談論搜索引擎抓取的任何文檔以及頁面上存在的所有各種元素。 其中包括 JavaScript 和 CSS 文件、移動頁面變體、結構化數據和 PDF 文件。

抓取限制如何工作?

爬取限制是關於保持爬取和服務器資源之間的平衡。

在抓取網站時,搜索引擎會監控服務器的響應方式。 如果服務器快速響應,抓取速度可能會增加。

如果服務器出現壓力跡象,搜索引擎可能會降低抓取速度以減輕服務器負載。

網站所有者還可以在網站的 robots.txt 文件中實現抓取延遲。 這指示爬蟲在對網站的連續請求之間暫停一段時間。

抓取需求如何運作?

抓取需求衡量頁面對 GoogleBot 的重要性。

搜索引擎關注內部鏈接結構、外部鏈接和用戶參與信號,以確定哪些頁面具有更高的抓取需求。

以下是 Google 搜索中心對其的描述:

反向鏈接是網頁可信、受歡迎且值得抓取的信號。

具有大量來自權威來源的高質量反向鏈接的網站會獲得更大的抓​​取預算。

谷歌還希望為用戶提供最新的搜索結果,因此優先抓取和索引新鮮內容。

為什麼抓取預算對 SEO 很重要?

抓取預算直接影響搜索引擎如何發現和索引您網站的頁面。

但值得注意的是,抓取預算本身並不是排名因素。

它通常也不會影響較小的站點。

最近的一段視頻,Google 搜索倡導者 Daniel Waisberg 透露:

“如果你在大型網站上工作,它會更相關。如果您的網站頁面少於幾千頁,則無需擔心。”

如果你有一個擁有大量頁面的大型網站或電子商務商店,你只需要擔心抓取預算。

抓取預算會影響或受以下因素影響:

在搜索結果中的可見性

當抓取預算有限時,Google 可能需要更長的時間來抓取新頁面和內容並對其進行排名。 如果 Google 由於抓取預算問題而找不到網頁,它就不會出現在搜索結果中。

網站結構

如果您通過一系列重複或低價值的頁面來浪費抓取預算,Google 將很難了解哪些頁面很重要。 GoogleBot 會花時間抓取您網站上無助於您針對目標關鍵字進行排名的部分。

良好的網站結構有助於搜索引擎確定您的頁面之間的關係,這反過來又可以構建您的語義 SEO。

專題權威

優先抓取重要頁面並專注於高質量內容可以提高您的主題權威。

它增加了您在相關搜索詞中排名更高的機會。

關鍵字蠶食

關鍵字蠶食是指網站上的兩個頁面在搜索結果中競爭相同的關鍵字。

抓取預算優化可幫助您避免這種情況。

組織您的網站結構並避免重複的內容可以讓 Google 更輕鬆地抓取您的網站並理解您的內容,同時確保您的網頁獨一無二並避免在搜索結果中相互競爭。

您如何優化 SEO 的抓取預算?

那麼,如何優化抓取預算以獲得更好的 SEO 結果呢?

以下是您可以實施的六種策略:

策略 1:查看您的服務器日誌和抓取統計報告

首先分析您的服務器日誌文件。

這些日誌包含有關搜索引擎抓取工具如何與您的網站交互的寶貴信息。 您可以了解正在抓取哪些頁面、訪問它們的頻率以及是否發生任何抓取錯誤。

Google Search Console 中的抓取統計報告也可以提供有用的見解。

您可以看到抓取趨勢圖表、主機狀態詳細信息和抓取請求細分。

策略 2:增加抓取預算

雖然您無法直接控制搜索引擎分配的抓取預算,但您仍然可以影響它。

關鍵是要提高網站的整體質量和相關性。

以下是 Mobilo 首席執行官 Peter Nikolow 的細分:

以下是如何將此建議付諸實踐:

定期發布新鮮優質內容

用新鮮的內容更新您的網站可以向搜索引擎表明您的網站是活躍的。

它向搜索引擎發出信號,表明您的內容提供了有價值的信息,可能會增加您網站的抓取預算。

改善頁面加載時間

頁面加載緩慢會阻礙抓取和索引過程。

谷歌是這樣描述它的:

如果您的網頁加載速度很快,Google 就可以探索您網站的更多內容並為您的更多網頁編制索引。

致力於壓縮圖像並使用緩存技術來提高站點速度。

確保移動友好性

Google 使用您網站的移動版本進行索引和排名。

因此,擁有適合移動設備的網站至關重要。

以下是來自 Google 搜索中心博客的一些提示:

策略三:網站維護:減少錯誤

損壞的鏈接、404 頁面和服務器錯誤會減慢搜索引擎爬蟲的速度並耗盡您的爬網預算。

這可能包括導致無處可去的斷開鏈接、無法找到的頁面或導致中斷的服務器問題。

進行例行網站審核,以識別未正確抓取或導致錯誤的任何頁面。

策略 4:阻止爬蟲訪問您網站的某些部分

有時,您網站的某些部分可能與搜索引擎抓取或索引並不真正相關。

想想管理頁面和重複的內容。

您可以使用“robots.txt”文件告訴搜索引擎爬蟲避開這些部分。

這樣,GoogleBot 就可以專注於探索您網站的重要頁面並為其編制索引。

策略 5:減少重定向鏈

重定向鏈可能會用完您的抓取預算。

GoogleBot 在最終登陸目標 URL 之前必須連續導航多個重定向。

所有這些不必要的重定向都會佔用抓取預算,而不會提供任何額外價值。

最小化重定向鏈可以幫助搜索引擎更快地到達目標頁面。 它使爬蟲和用戶從 A 點到 B 點的旅程更加容易。

策略 6:獲得更多的內部和外部鏈接

從值得信賴的網站獲得更多反向鏈接可以提高您網站的知名度和權威性。

由於搜索引擎將您視為權威來源,因此他們更有可能為您的網站分配更多的抓取預算。

內部鏈接也很重要。

抓取預算的最大浪費之一是孤立頁面。

這些網頁沒有任何指向它們的內部鏈接或外部鏈接。

根據 Botify 最近的一項研究,未鏈接的頁面消耗了 Google 26% 的抓取預算:

資料來源:Botify

上下文內部鏈接可幫助 GoogleBot 查找您網站上的所有頁面並將其編入索引。

通過確保要索引的每個頁面都有至少一個指向它的內部鏈接,您可以更有效地利用爬網預算。

充分利用您網站的抓取預算

抓取預算優化是成功的 SEO 策略的重要組成部分。

它旨在讓 GoogleBot 盡可能簡單。 通過了解抓取預算的工作原理以及如何對其進行優化,您可以確保 Google 盡可能頻繁地抓取您的網頁並將其編入索引。

這將提高您在搜索結果中的可見度並幫助您吸引更多自然流量

您投入時間、精力和金錢來製作內容豐富的高質量網頁; 通過確保搜索引擎可以抓取和查看您的頁面來確保這不是浪費工作。

最後,您是否對所有 Google 爬蟲和抓取器進行了全面分析,包括它們的用戶代理令牌和用例? 查看下面我們方便的信息圖!