什麼是 XML 站點地圖以及如何創建?

已發表: 2020-11-20

建立一個網站需要大量的紀律和好奇心才能在不斷擴大的互聯網環境中引起注意——搜索引擎優化成功的基本步驟之一是站點地圖。

站點地圖協議是您網站的路線圖。 有用的站點地圖可以讓搜索引擎更有效地抓取您的網站。 谷歌於 2005 年首次引入該協議,允許開發人員從他們的網站發布鏈接。

雅虎和微軟在 2006 年聯合支持,那年晚些時候,Ask.com 和 IBM 也支持新協議。 該協議的一項重大進步是通過 robots.txt 文件進行自動發現。

什麼是站點地圖?

搜索引擎的功能是在互聯網上搜索新代碼和網頁。 第二個功能是索引內容並將其放置在可發現的層次結構中——拼圖的最後一塊; 向相關查詢顯示內容。

站點地圖是網站和搜索引擎之間的接口。 谷歌站點地圖是一種 XML 文件擴展名,使網站管理員能夠告訴爬蟲機器人有關新的和更改的 URL。 有用的站點地圖會告訴機器人該 URL 的最後更新時間及其對站點中其他 URL 的重要性。 這是站點地圖的外觀:

什麼是 XML 站點地圖

(圖片來源:DYNO 映射器)

人類使用站點地圖作為其網站的 SEO 標記。 但是,應該充分理解:站點地圖索引是針對搜索引擎爬蟲的。 網站管理員可以做任何事情來增加這種溝通,更好。

搜索引擎會定期發送爬蟲機器人或蜘蛛來查找更新的內容。 機器人是與引擎和您的網站交互的一小段代碼。 您的站點地圖越高效,搜索引擎就越容易發現和索引新內容和鏈接。

爬行是機器人基於搜索引擎的頻率算法和其他因素訪問網站的過程。 爬蟲使用鏈接來發現密切關注新內容和現有主題變化的其他頁面。

當搜索機器人抓取他們的網站時,谷歌和其他引擎給了網站管理員一個細粒度的選擇。 此功能是對過去神秘政策的重大改進。

如果您正在設置您的 google 站點地圖,則需要遵循幾個條件:

  • 您的站點地圖的位置必須在您網站的根目錄中。 爬網機器人通常從根部開始向外移動。 如果有站點地圖,您就可以更輕鬆地使用機器人。
  • 其次,每個後續 URL 必須與站點地圖相同。 如果站點地圖具有 HTTP: 協議,則每個 URL 都必須具有相同的 HTTP: 擴展名。
  • 主要搜索引擎現在允許在一個目錄中放置多個站點地圖文件,以便於抓取。 單個站點地圖文件中允許的最大 URL 數為 50,000。 網站管理員可以進一步分解這個數​​字,並擁有多個站點地圖來更好地定義網站結構。
  • 按照 Sitemaps.org 的站點地圖格式為您的站點建立正確的架構。

搜索引擎優化和您的站點地圖

每個網站都需要一個站點地圖以及如何創建 xml 站點地圖的知識,無論是具有單個頁面的新站點還是具有數千種產品的電子商務商店。 當搜索引擎可以輕鬆找到重要頁面以及上次更新的時間時,網站會受益。

您網站結構中的站點地圖會告訴搜索引擎,每個包含的 URL 都是一個高質量的目標網頁。

SEO最佳實踐總是在不斷變化; 昨天關於如何創建 xml 站點地圖的優秀建議今天可能已經改變。 了解您網站所針對的每個搜索引擎的 SEO 最佳實踐的位置是明智的建議。

遠離博客和論壇上的放大觀點。 專注於重要的事情,例如 google xml 站點地圖要求。 花時間傳播噪音並從主要引擎中形成最佳實踐。

你會感興趣

XML 站點地圖的格式

  • org 是什麼是站點地圖 xml 協議以及如何構建站點地圖的權威來源。 XML 站點地圖的正確格式由一系列描述性標籤組成。 每個值都必須是實體轉義的,這意味著站點地圖是 UTF-8 編碼的。 例如:

什麼是 XML 站點地圖

(圖片來源:站點地圖)

UTF-8 是 Unicode Transformation Format-8 Bit 的縮寫。 該名稱代表標準可變寬度的電子通信字符。 另一個格式化條件:站點地圖的每個 URL 都必須經過編碼,以便 Web 服務器可讀。

以下是站點地圖標籤定義; 有些是 google xml 站點地圖的一些要求,而另一些則是可選的。

  • <urlset>是必需的標記。 本標準引用; 什麼是站點地圖 xml 協議並描述了文件。
  • <url>是每個條目的父標籤。 此條目之後的每個標籤都是一個子標籤。
  • <loc>是另一個必需的標記。 此功能引用 URL 並以 HTTP 或 HTTPS 等協議開頭,如果 Web 服務器需要,它必須以正斜杠結尾。 此值必須少於 2,048 個字符。
  • <lastmod>是一個可選標籤,用於定義文件最後一次修改的時間。 標記必須採用 W3C 日期時間格式。 該標籤與 if-modified-since 標籤是分開的。 搜索引擎可能會使用來自其他來源的信息。
  • <changefreq>是另一個可選標籤,可提高站點地圖的可搜索性。 此標記顯示頁面可能更改的頻率。

Always,用於描述每次訪問時都會更改的文檔:

  • 每小時
  • 日常
  • 每週
  • 月刊
  • 每年
  • 從不,歸檔的 URL

網絡爬蟲可能比每小時更頻繁地訪問頁面,並且可能更頻繁地爬取標記為每年的頁面。 標有 never 的頁面可能會被抓取以處理意外更改。

  • <priority>是網站上其他 URL 的相對 URL 標記。 值範圍從 0.0 到 1.0,默認值為 0.5。 該值不會影響頁面與其他網站的比較方式。 該標籤顯示了 google xml 站點地圖要求以及網站管理員認為哪些頁面對爬蟲最重要。

分配的優先級不太可能影響搜索位置。 網站管理員可以使用這個標籤來增加最重要的頁面被索引的可能性。

創建站點地圖

如果這是您第一次創建站點地圖索引,一開始可能會讓人不知所措。 站點地圖是為搜索引擎抓取機器人而不是人類製作的。 正如我們所說,現代 SEO 中有很多工具可以創建完美的站點地圖。

了解 XML 的結構以確保工具正常工作至關重要。

讓我們分解一個簡單的站點地圖:

  • XML 聲明:這個聲明告訴搜索引擎機器人他們正在閱讀什麼; 在大多數情況下,它是一種 XML 文件類型。 其他聲明告訴機器人; 版本信息和編碼類型。 站點地圖必須是 UTF-8。
  • URL 集:此部分包含站點地圖中的 URL。 URL Set 通知機器人使用哪種標準。 最常見的標準是 0.90,Google、Microsoft 和 Yahoo 都支持該標準。
  • URL :網站管理員必須告訴機器人 <loc> 標記中嵌套的每個 URL。 陳述是至關重要的; URL 必須是絕對的,而不是相對的規範 URL。 <loc> 標籤是這個階段唯一需要的元素。

在網站管理員聲明 URL 後,他們可以使用上面的任何可選標籤來進一步了解每個條目。 僅包括相關的 SEO 頁面; 您可以幫助爬行機器人更智能地工作,這反過來又可以幫助您的父親從良好的爬行會話中獲益。

爬蟲程序到達具有預定參數的網站,用於爬取 xml 站點地圖示例站點。 這些參數通常基於最後的結果。 不要通過包含相關性較低的網站頁面來浪費寶貴的爬網機器人時間——只有最好的。

在 60 秒內測試您網站的 SEO 和性能!

良好的網站設計對訪問者的參與度和轉化率至關重要,但網站速度緩慢或性能錯誤甚至可能使設計最好的網站表現不佳。 Diib 是世界上最好的網站性能和 SEO 監控工具之一。 Diib 利用大數據的力量幫助您快速輕鬆地增加流量和排名。 正如在企業家中看到的!

  • 易於使用的自動化 SEO 工具
  • 關鍵字和反向鏈接監控+想法
  • 確保速度、安全性和核心生命體徵跟踪
  • 智能地提出改進 SEO 的想法
  • 超過 250,000,000 名全球會員
  • 內置基準測試和競爭對手分析

例如“www.diib.com”

被超過 250,000 家公司和組織使用:

  • 標識
  • 標識
  • 標識
  • 標識

谷歌分析

鏈接建設

不包含在您的站點地圖中的頁面:

  • 實用程序和存檔頁面
  • robots.txt 文件和 noindex 頁面阻止的頁面
  • 重複和分頁的頁面和帖子
  • 非規範頁面
  • 回複評論和電子郵件 URL
  • 重定向、丟失頁面和錯誤頁面

小心使用 html 站點地圖生成器。 有些是不可靠的,並且通過包含非規範的 URL 和無索引頁面來練習糟糕的 SEO。

在站點地圖中包含低質量頁面會產生可怕的 SEO 後果:

  • 第一個也是最重要的; 他們浪費了寶貴的抓取預算時間。 這段時間最好只充分探索您網站上最好的頁面和鏈接。
  • 低質量的頁面會從排名更高的頁面中竊取鏈接權限。 例如,aHrefs 博客刪除了三分之一的無關緊要的帖子,發現流量增加了。
  • 如果定向到非必要頁面,用戶會發現較低級別的體驗。 訪問者在訪問網站毫無價值的頁面時會感到惱火,並會很快離開。 只保留網站上最好的頁面。

不同類型的站點地圖

現在全世界有 140 多個搜索引擎和目錄。 據最新統計,谷歌已經索引了近 45 億個網頁。 隨著互聯網的發展,站點地圖類型的數量也在增長,html 站點地圖生成器。 問題是否變成了 seo 中的 sitemap.xml 是什麼?

隨著網站的複雜性和規模不斷增長,站點地圖技術也將如此。

XML 站點地圖

XML Sitemap 是讓您的網站在 Internet 上受到關注的標准文件。 但是,XML 站點地圖有一些限制。 最多可以處理 50,000 個 URL,並且大小限制為 50 mb。

如果您的站點地圖超出了這兩個限制中的任何一個,則需要將它們拆分為另一個站點地圖文件。 如果需要,大型站點可以通過創建多個索引文件來採取細粒度的方法。

來自 Google Webmaster Blog,多個索引文件的 xml 站點地圖示例:

  1. xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml

創建單獨的索引文件是多站點佈置的理想選擇。 或者想要在一天中的不同時間提交內容的商店。 網站管理員質疑什麼是 seo 中的 sitemap.xml。 下圖顯示了 XML Sitemap 的另一個示例:

什麼是 XML 站點地圖

(圖片來源:搜索引擎雜誌)

XML 圖像站點地圖

XML Image Sitemap 是具有大量視頻或圖像以及內容的站點的絕佳資源。

由於現代 SEO 實踐,圖像站點地圖可能是不必要的。 大多數網站的頁面中都嵌入了圖像。 搜索引擎抓取圖像以及任何頁面內容。 以下是 XML 圖像站點地圖的示例:

什麼是 XML 站點地圖

(圖片來源:SwissUpLabs)

使用標記; JSON-LD schema.org/ImageObject,為網站管理員提供更多自定義選項。

對於大多數網站來說,圖片站點地圖佔用了太多的抓取預算。 如果您有一個網站,其中圖像是網站的基本組成部分,請仔細查看選項。 電子商務和遊戲網站可能會受益於站點地圖圖像文件。

視頻 XML 文件

視頻 XML 文件類似於圖像站點地圖。 如果視頻對您網站的成功至關重要,請提交一個視頻 XML 文件以供抓取。 例如:

什麼是 XML 站點地圖

(圖片來源:莫茲)

同樣,當機器人開始爬行時,不要浪費網站所擁有的寶貴時間。

動態 XML

動態 XML 會自動更新站點地圖,否則這些站點地圖將是過時的內容。 一旦內容以任何方式更改或修訂,靜態站點地圖就會過時。 靜態站點地圖不利用 lastmod 標記。

現代 SEO 最佳實踐為不斷變化的內容設計了動態站點地圖。 每當進行更改時,網站管理員的服務器都會自動提交新的站點地圖。

這些步驟中的任何一個都可以幫助網站管理員構建動態站點地圖文件:

  • 讓您的開發人員編寫自定義腳本; 指出所涉及的任務
  • 使用站點地圖生成器工具
  • 大多數 CMS 平台都提供插件來生成動態站點地圖 XML 文件。

HTML 站點地圖

HTML 站點地圖是老式的索引文件,只有在其他 XML 文件不適合應用程序時才應使用。 HTML 站點地圖旨在幫助人類用戶查找內容。

HTML 站點地圖證明了站點鏈接質量的質量。 出於任何原因,應仔細考慮 HTML 站點地圖的存在。 如果網站管理員設計的網站具有嚴格的鏈接政策和 XML 站點地圖; 問你自己; 是否需要 HTML 站點地圖?

在大多數情況下; 不。

我們希望您發現這篇文章很有用。

如果您想更有趣地了解您的網站健康狀況,獲得個人推薦和提醒,請通過 Diib 掃描您的網站。 只需 60 秒。

輸入您的網站

例如“www.diib.com”

我無法得到足夠的DIIB! 最好的工具,我很感激找到它。 我絕對喜歡它! 祈禱你不要提高價格,因為這太完美了。
感言
卡塔琳娜·蓋奇
ahoymatey.com.au 的運營總監

谷歌新聞站點地圖

Google 新聞站點地圖僅限於在搜索引擎中註冊的站點。 限制是最近兩天發布的新聞文章,最多 1000 個 URL。

Google 新聞站點地圖不支持圖片或視頻站點地圖。

搜索引擎建議使用 schema.org 來指定縮略圖的屬性。 例如:

什麼是 XML 站點地圖

(圖片來源:G-Squared Interactive)

移動站點地圖

移動站點地圖是遺留代碼,可供網站管理員使用,但通常不需要。 移動 XML 文件用於功能手機頁面,而不是智能手機。 這些站點地圖對網站管理員沒有任何好處,除非網站具有此平台類型的特定 URL。

使用站點地圖優化 SEO

現在已經涵蓋了基礎知識,是時候看看站點地圖對網站的價值了。 網站管理員不應將其網站的每個頁面都包含在站點地圖中,而應僅包含相關的 SEO 權威頁面。

創建站點地圖的五個 SEO 理由

  • 站點地圖是免費的,而且很容易創建。 如前所述,每個 CMS 平台都有多個站點地圖插件和腳本。 僅 WordPress 就有數十種不同的應用程序,從單個站點地圖到全面的 SEO 服務。

站點地圖是非常寶貴的 SEO 工具。 他們鼓勵每個搜索引擎為您網站的更多內容編制索引並正確編制索引。

建議將站點地圖創建為整體有效的 SEO 策略的一部分。 WordPress 功能; Yoast SEO 和提供有用功能的多合一插件。

  • 提升排名。 圖片和視頻可以通過向爬網機器人提供額外信息來提高您網站的搜索排名。

為您網站上託管的視頻使用站點地圖意味著網站管理員可以為每個視頻添加額外的元數據。 該信息可以包括位置、標題、描述、持續時間、查看次數和類別。 您網站中嵌入的每個圖像都可以包含相同的數據。

  • 爬行優先。 使用站點地圖為高價值頁面提供爬行優先級。 如果沒有網站路線圖,爬蟲機器人一旦進入您的網站就沒有方向。

控制抓取過程應該是網站管理員的首要任務。 網站管理員可以為他們的每個頁面創建優先級。 例如,主頁可以有 100% 的優先級,而低級文檔可能有 60% 的優先級。 這種靈活性有利於逐頁定義站點的價值。

  • 發現更多頁面。 有效的站點地圖有助於爬網機器人發現更多頁面,這意味著更多內容被編入索引。

站點地圖並不能保證更高的搜索結果,只能保證更多的網站內容被發現。

站點地圖的另一個重要功能是防止重複內容。 稍後發布原始內容以在競爭對手的網站上找到相同的內容是令人沮喪的。

如果找到兩個相同的內容,引擎會嘗試保留原始內容並丟棄重複內容。 如果使用有效的站點地圖,搜索引擎會更頻繁地抓取站點。 他們並不總能在原件上得到正確的選擇,但您確實有保護。

  • 鏈接。 如果網站包含站點地圖,搜索引擎(主要是 Google)可能會向網站添加額外的站點鏈接。 谷歌的算法可能會在網站的自然列表下添加有價值的鏈接,讓用戶更全面地了解查詢。 這個過程是自動化的; 但是,如果網站有站點地圖,機會會更好。
  • 錯誤被最小化。 抓取錯誤突出顯示; 如果您向 Google 提供有效站點地圖的位置,則搜索引擎會通過向網站管理員提供有關抓取的信息來回報您的青睞。 使用 Google Search Console 和 Bing Webmaster 提交任何站點地圖。

機器人爬取網站並報告他們的發現。 此資源對於 SEO 最佳實踐非常寶貴。

Diib:獲取 XML 站點地圖的最新指標

SEO 從根目錄中網站的粒度級別開始。 網站管理員應該了解每個站點和頁面的層次結構,並在構建它們時考慮到搜索引擎。 Diib Digital 提供有關您的 XML 站點地圖健康狀況的最全面和最新的指標,並會在可能的問題嚴重影響您的排名或流量之前就提醒您注意這些問題。 以下是您會喜歡的用戶儀表板的一些功能:

  • 站點地圖跟踪和健康
  • 24/7 域監控
  • 跳出率修復
  • 後期表現
  • 有反向鏈接的損壞頁面(404 檢查器)
  • 關鍵字、反向鏈接和索引監控和跟踪工具
  • 用戶體驗和移動速度優化

獲得 60 秒的免費站點掃描或直接致電 800-303-3510 與我們的一位增長專家交談。