Ce este un Sitemap XML și cum se creează unul?
Publicat: 2020-11-20Construirea unui site web necesită multă disciplină și curiozitate pentru ca acesta să fie observat într-un peisaj de internet în continuă expansiune - unul dintre pașii fundamentali pentru succesul SEO este o hartă a site-ului.
Un protocol de hartă de site este o foaie de parcurs către site-ul dvs. Sitemap-urile utile permit motoarelor de căutare să acceseze cu crawlere site-ul dvs. mai eficient. Google a introdus pentru prima dată protocolul în 2005, permițând dezvoltatorilor să publice link-uri de pe site-urile lor.
Suportul comun de la Yahoo și Microsoft a venit în 2006, iar mai târziu în acel an, Ask.com și IBM și-au oferit sprijinul noului protocol. Una dintre progresele semnificative ale protocolului a fost auto-descoperirea prin fișierul robots.txt.
Ce este un Sitemap?
Funcția unui motor de căutare este de a căuta pe internet coduri și pagini web noi. O a doua funcție este de a indexa conținutul și de a-l plasa într-o ierarhie care poate fi descoperită - piesa finală a puzzle-ului; afișarea conținutului la interogările relevante.
Sitemap-urile sunt interfața dintre un site web și motoarele de căutare. O hartă a site-ului Google este o extensie de fișier XML care oferă webmasterilor posibilitatea de a informa roboții crawler despre adrese URL noi și modificate. Sitemap-urile utile indică roboților când URL-ul a fost actualizat ultima dată și importanța acesteia pentru alte adrese URL de pe site. Iată cum poate arăta un sitemap:

(Credit imagine: DYNO Mapper)
Oamenii folosesc hărțile de site ca marker SEO pentru site-urile lor web. Cu toate acestea, ar trebui să fie pe deplin înțeles: un index de hartă de site este pentru roboții de crawlere ale motorului de căutare. Tot ce pot face webmasterii pentru a crește această comunicare, cu atât mai bine.
Motoarele de căutare trimit periodic roboți cu crawler sau păianjeni pentru a găsi conținut actualizat. Boții sunt mici bucăți de cod care interfață cu motorul și site-ul dvs. Cu cât harta site-ului dvs. este mai eficientă, cu atât este mai ușor pentru un motor de căutare să descopere și să indexeze conținut și link-uri noi.
Crawling-ul este procesul prin care roboții vizitează site-uri web pe baza algoritmului de frecvență al unui motor de căutare și alți factori. Crawlerele folosesc linkuri pentru a descoperi alte pagini, acordând o atenție deosebită conținutului nou și modificărilor existente ale subiectului.
Google și alte motoare au oferit webmasterilor o alegere granulară atunci când botul de căutare își accesează cu crawlere site-urile. Această caracteristică reprezintă un progres semnificativ față de politicile arcane din trecut.
Dacă vă configurați sitemap-ul Google, există câteva condiții care trebuie respectate:
- Locația sitemap-ului dvs. trebuie să fie în directorul rădăcină al site-ului dvs. web. Boții de crawlere încep, în general, de la rădăcină și se deplasează în exterior. Dacă există o hartă a site-ului, ați făcut mai ușor pentru bot.
 - În al doilea rând, fiecare adresă URL ulterioară trebuie să fie aceeași cu harta site-ului. Dacă harta site-ului are protocolul HTTP:, fiecare adresă URL trebuie să aibă aceeași extensie HTTP:.
 - Motoarele de căutare majore permit acum mai multe fișiere de hartă site într-un singur director pentru ușurința accesării cu crawlere. Numărul maxim de adrese URL permise într-un singur fișier sitemap este de 50.000. Webmasterii pot defalca acest număr în continuare și pot avea mai multe hărți de site pentru a defini mai bine structura site-ului.
 - Urmați formatele de hartă site de pe Sitemaps.org pentru a stabili schema potrivită pentru site-ul dvs.
 
SEO și Sitemap-ul dvs
Fiecare site are nevoie de o hartă de site și de cunoștințele despre cum să creeze hărți de site xml, fie că sunt noi cu o singură pagină sau un magazin de comerț electronic cu mii de produse. Site-urile web beneficiază atunci când motoarele de căutare pot găsi cu ușurință pagini importante și când au fost actualizate ultima dată.
O hartă a site-ului din structura site-ului dvs. le spune motoarelor de căutare că fiecare adresă URL inclusă este o pagină de destinație de calitate.
Cele mai bune practici SEO sunt mereu în flux; ceea ce a fost sfatul excelent ieri cu privire la crearea unui sitemap xml s-ar putea să se fi schimbat astăzi. Este un sfat înțelept să cunoașteți locația celor mai bune practici SEO pentru fiecare dintre motoarele de căutare pe care site-ul dvs. îl vizează.
Stai departe de opiniile amplificate pe bloguri și forumuri. Concentrați-vă pe ceea ce este esențial, cum ar fi cerințele pentru un sitemap google xml. Fă-ți timp pentru a disemina zgomotul și a forma cele mai bune practici din motoarele majore.
Vei fi interesat
Cum să-ți extinzi afacerea cu succes
Viteza de încărcare a site-ului web: instrumente pentru optimizare
Verificarea sănătății site-ului web: instrumente și sfaturi
Ce înseamnă UX?
Formatul unui Sitemap XML
- org este sursa definitivă a ceea ce este protocolul xml sitemap și modul de structurare a unui sitemap. Formatarea corectă a unui sitemap XML constă dintr-o serie de etichete descriptive. Fiecare valoare trebuie să fie cu escape de entitate, ceea ce înseamnă că harta site-ului este codificată UTF-8. De exemplu:
 

(Credit imagine: Sitemaps)
UTF-8 este prescurtarea pentru Unicode Transformation Format-8 Bit. Această denumire reprezintă un caracter de comunicare electronică cu lățime variabilă standard. O altă condiție de formatare: fiecare URL a hărții site-ului trebuie să fie codificată pentru a fi lizibilă de către serverul web.
Următoarele sunt definițiile etichetelor sitemap; unele sunt câteva dintre cerințele google xml sitemap, în timp ce altele sunt opționale.
- <urlset> este o etichetă obligatorie. Acest standard face referire la; ce este protocolul xml sitemap și descrie fișierul.
 - <url> este eticheta părinte pentru fiecare intrare. Fiecare etichetă după această intrare este o etichetă secundară.
 - <loc> este o altă etichetă obligatorie. Această caracteristică face referire la adresa URL și începe cu un protocol precum HTTP sau HTTPS și trebuie să se încheie cu o bară oblică dacă serverul web o cere. Această valoare trebuie să fie mai mică de 2.048 de caractere.
 - <lastmod> este o etichetă opțională care definește momentul în care fișierul a fost modificat ultima dată. Eticheta trebuie să fie într-un format W3C Datetime. Eticheta este separată de eticheta if-modified-since. Motoarele de căutare pot folosi informații din surse alternative.
 - <changefreq> este o altă etichetă opțională care îmbunătățește capacitatea de căutare a hărții site-ului. Această etichetă afișează cât de des este probabil să se schimbe pagina.
 
Întotdeauna, folosit pentru a descrie documente care se vor schimba de fiecare dată când sunt accesate:
- Orar
 - Zilnic
 - Săptămânal
 - Lunar
 - Anual
 - Niciodată, URL-uri arhivate
 
Crawlerele web pot accesa o pagină mai des decât pe oră și pot accesa cu crawlere paginile marcate anual mai des. Paginile marcate cu niciodată pot fi accesate cu crawlere pentru a face față modificărilor neașteptate.
- <priority> este o etichetă URL relativă la alte adrese URL de pe site. Valorile variază de la 0,0 la 1,0, implicit fiind 0,5. Valoarea nu afectează modul în care paginile sunt comparate cu alte site-uri. Eticheta afișează cerințele pentru hărțile de site google xml și paginile pe care webmasterul le consideră cele mai importante pentru crawlere.
 
Nu este probabil ca prioritățile atribuite să influențeze poziția de căutare. Webmasterii pot folosi această etichetă pentru a crește probabilitatea ca cele mai importante pagini să fie indexate.
Creați un Sitemap
Crearea unui index de hartă de site poate părea copleșitoare la început dacă este prima dată. Sitemap-urile sunt create pentru roboții de crawlere ale motoarelor de căutare, nu pentru oameni. După cum am afirmat, există o mulțime de instrumente în SEO modern care creează sitemap-uri perfecte.
Este vital să înțelegeți structura XML pentru a vă asigura că instrumentele își fac treaba.
Să descompunem un sitemap simplu:
- Declarație XML : această declarație îi spune botului motorului de căutare ce citește; în cele mai multe cazuri, este un tip de fișier XML. Alte declarații spun botului; informații despre versiune și tip de codificare. Harta site-ului trebuie să fie UTF-8.
 - Set URL : această secțiune conține adresele URL din harta site-ului. Setul URL informează roboții despre ce standard este utilizat. Cel mai comun standard este 0.90, care este acceptat de Google, Microsoft și Yahoo.
 - Adresă URL : webmasterii trebuie să spună botului fiecărei adrese URL imbricate în eticheta <loc>. Este crucial să afirmăm; URL-urile trebuie să fie absolute, nu relative, URL-uri canonice. Eticheta <loc> este singurul element necesar în această etapă.
 
După ce webmasterul declară adresa URL, poate folosi oricare dintre etichetele opționale de mai sus pentru a înțelege fiecare intrare în continuare. Includeți numai pagini SEO relevante; ajutați botul de crawl să funcționeze mai inteligent, ceea ce la rândul său îl ajută pe tatăl dvs. să culeagă beneficiile unei sesiuni bune de crawlere.
Un bot de accesare cu crawlere ajunge la un site web cu parametri predeterminați pentru accesarea cu crawlere a unui site de exemplu de hartă de site xml. Acești parametri se bazează de obicei pe ultimele rezultate. Nu pierdeți timp valoros pentru robotul de accesare cu crawlere, incluzând pagini de site web mai puțin relevante - doar cele mai bune.
Testează SEO și performanța site-ului tău în 60 de secunde!
Un design bun al site-ului web este esențial pentru implicarea vizitatorilor și pentru conversii, dar un site lent sau erorile de performanță pot face chiar și cel mai bine conceput site-ul să aibă performanțe slabe. Diib este unul dintre cele mai bune instrumente de monitorizare SEO și performanță a site-ului web din lume. Diib folosește puterea datelor mari pentru a vă ajuta să vă creșteți rapid și ușor traficul și clasamentele. După cum se vede în Entrepreneur!
- Instrument SEO automatizat ușor de utilizat
 - Monitorizare cuvinte cheie și backlink + idei
 - Asigură viteza, securitatea și urmărirea Core Vitals
 
- Sugerează în mod inteligent idei pentru a îmbunătăți SEO
 - Peste 250.000 de mii de membri la nivel mondial
 - Benchmarking și analiză a concurenței încorporate
 
Folosit de peste 250.000 de companii și organizații:
 Se sincronizează cu 
Pagini care nu trebuie incluse în sitemap:
- Pagini utilitare și arhivate
 - Pagini blocate de fișierul robots.txt și paginile noindex
 - Pagini și postări duplicate și paginate
 - Pagini non-canonice
 - Răspunsuri la comentarii și adrese URL de e-mail
 - Redirecționare, pagini lipsă și pagini de eroare
 
Fiți atenți cu un generator de sitemap html. Unele nu sunt de încredere și practică un SEO prost, incluzând URL-uri non-canonice și pagini noindex.

A avea pagini de calitate scăzută într-un sitemap are consecințe îngrozitoare pentru SEO:
- Primul și cel mai important; pierd timp valoros din bugetul de accesare cu crawlere. Acest timp ar putea fi petrecut mai bine explorând pe deplin numai cele mai bune pagini și link-uri de pe site-ul dvs.
 - Paginile de calitate scăzută fură autoritatea linkurilor de la paginile care se pot clasa mai sus. De exemplu, blogul aHrefs a șters o treime din postările lor nesemnificative și a constatat că traficul a crescut.
 - Utilizatorii găsesc o experiență de nivel inferior dacă sunt direcționați către pagini neesențiale. Vizitatorii sunt enervați când ajung pe pagini fără valoare ale unui site web și se vor îndepărta rapid. Păstrați numai cele mai bune pagini de pe un site web.
 
Diferite tipuri de sitemap-uri
Există acum peste 140 de motoare de căutare și directoare în întreaga lume. La ultimul număr, Google a indexat aproape 4,5 miliarde de pagini web. Pe măsură ce internetul crește, crește și numărul de tipuri de sitemap, generator de sitemap html. Întrebarea devine ce este sitemap.xml în seo?
Pe măsură ce complexitatea și dimensiunea site-urilor web continuă să crească, la fel vor crește și tehnologiile sitemap.
Harta site XML
XML Sitemap este fișierul standard pentru a vă face remarcat site-ul pe internet. Cu toate acestea, există anumite limitări pentru harta site-ului XML. Nu pot fi procesate mai mult de 50.000 de adrese URL și există o limită de dimensiune de 50 mb.
Dacă sitemap-ul dvs. depășește oricare dintre cele două limite, acestea vor trebui împărțite într-un alt fișier sitemap. Site-urile mari pot adopta o abordare granulară prin crearea mai multor fișiere index, dacă este necesar.
Din Blogul pentru webmasteri Google, exemplu de hartă de site xml cu mai multe fișiere index:
- xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml
 
Crearea de fișiere index separate este ideală pentru un aranjament cu mai multe site-uri. Sau magazine care doresc să trimită conținut în diferite momente ale zilei. Webmasterii se întreabă ce este sitemap.xml în seo. Imaginea de mai jos arată un alt exemplu de Sitemap XML:

(Credit imagine: Search Engine Journal)
Harta site-ului imagine XML
XML Image Sitemap este o resursă excelentă pentru site-urile cu o mulțime de videoclipuri sau imagini împreună cu conținut.
Sitemapurile cu imagini pot fi inutile din cauza practicilor SEO moderne. Majoritatea site-urilor web au imagini încorporate în paginile lor. Motoarele de căutare accesează cu crawlere imaginile împreună cu orice conținut al paginii. Iată un exemplu de Sitemap cu imagine XML:

(Credit imagine: SwissUpLabs)
Utilizați marcajul; JSON-LD schema.org/ImageObject, oferind webmasterului mai multe opțiuni de personalizare.
Sitemapurile cu imagini ocupă prea multe bugete de accesare cu crawlere pentru majoritatea site-urilor web. Dacă aveți un site web în care imaginile sunt o parte fundamentală a site-ului, aruncați o privire atentă la opțiuni. Site-urile de comerț electronic și de jocuri pot beneficia de un fișier imagine cu harta site-ului.
Fișiere XML video
Fișierele video XML sunt similare cu harta site-ului imagine. Dacă videoclipurile sunt esențiale pentru succesul site-ului dvs. web, trimiteți un fișier video XML pentru accesare cu crawlere. De exemplu:

(Credit imagine: Moz)
Din nou, nu pierdeți timpul prețios pe care îl au site-urile atunci când un bot se accesează cu crawlere.
XML dinamic
Dynamic XML actualizează automat hărțile de site care altfel ar fi conținut învechit. Sitemapurile statice devin învechite de îndată ce conținutul este modificat sau revizuit în vreun fel. Sitemapurile statice nu profită de eticheta lastmod.
Cele mai bune practici SEO moderne au conceput Sitemap-uri dinamice pentru conținut în continuă schimbare. Serverul unui webmaster trimite automat o nouă hartă a site-ului ori de câte ori se fac modificări.
Oricare dintre acești pași îl poate ajuta pe webmaster să creeze un fișier dinamic sitemap:
- Aveți codul de dezvoltator un script personalizat; subliniind sarcina implicată
 - Utilizați un instrument generator de hărți de site
 - Majoritatea platformelor CMS oferă pluginuri pentru a genera un fișier XML de hartă de site dinamic.
 
Sitemap-uri HTML
Sitemapurile HTML sunt fișiere de indexare vechi și ar trebui utilizate numai dacă alte fișiere XML nu se potrivesc aplicației. Sitemap-urile HTML au fost concepute pentru a ajuta utilizatorii umani să găsească conținut.
Sitemap-urile HTML atestă calitatea link-urilor unui site. Harta site-ului HTML trebuie luată în considerare cu atenție pentru orice motiv de existență. Dacă webmasterii și-au proiectat site-urile cu o politică fermă de conectare și un sitemap XML; intreaba-te pe tine insuti; este necesar un sitemap HTML?
În majoritatea cazurilor; Nu.
Sperăm că ați găsit acest articol util.
Dacă doriți să aflați mai multe despre sănătatea site-ului dvs., primiți recomandări și alerte personale, scanați-vă site-ul de către Diib. Durează doar 60 de secunde.
Google News Sitemaps
Sitemapurile Google News sunt limitate la site-urile înregistrate cu motorul de căutare. Restricțiile sunt articole de știri publicate în ultimele două zile până la maximum 1000 de adrese URL.
Sitemapurile Știri Google nu acceptă sitemap-uri imagine sau video.
Motorul de căutare recomandă utilizarea schema.org pentru a specifica atributele unei imagini în miniatură. De exemplu:

(Credit imagine: G-Squared Interactive)
Hărți de site mobile
Sitemapurile mobile sunt cod vechi și sunt disponibile pentru webmasteri, dar de obicei nu sunt necesare niciodată. Fișierele XML mobile sunt pentru pagini de telefon cu funcții, nu pentru smartphone-uri. Aceste hărți de site nu au niciun beneficiu pentru webmasteri decât dacă site-ul web are adrese URL specifice pentru acest tip de platformă.
Optimizarea SEO cu Sitemaps
Acum că elementele de bază au fost acoperite, este timpul să vedem cum site-urile sunt de neprețuit pentru site-uri web. Webmasterii nu ar trebui să includă fiecare pagină a site-ului lor într-o hartă a site-ului, ci doar paginile relevante, cu autoritate SEO.
Cinci motive SEO pentru a crea un Sitemap
- Sitemap-urile sunt gratuite și foarte ușor de creat. După cum am menționat mai devreme, fiecare platformă CMS are mai multe plugin-uri și scripturi pentru hărți de site. Numai WordPress are zeci de aplicații diferite, de la un singur sitemap la servicii SEO complete.
 
Sitemapurile sunt instrumente SEO neprețuite. Ei încurajează fiecare motor de căutare să indexeze mai mult din conținutul site-ului dvs. și să-l indexeze corect.
Este recomandabil să aveți o hartă a site-ului creată ca parte a unei strategii generale eficiente de SEO. Caracteristici WordPress; Yoast SEO și pluginuri All in One care oferă funcționalități utile.
- Clasament îmbunătățit. Imaginile și videoclipurile pot îmbunătăți clasarea în căutarea site-ului dvs., oferind informații suplimentare boților de accesare cu crawlere.
 
Utilizarea unui hartă site pentru videoclipurile găzduite pe site-ul dvs. înseamnă că webmasterii pot include metadate suplimentare pentru fiecare videoclip. Informațiile pot include locații, titlu, descriere, durată, număr de vizionări și categorii. Aceleași date pot fi incluse pentru fiecare imagine încorporată în site-ul dvs.
- Prioritate de crawling. Paginile cu valoare mare au prioritate de accesare cu crawlere cu un sitemap. Dacă nu există o foaie de parcurs către un site web, roboții de crawlere nu au nicio direcție odată ce ajung pe site-ul dvs.
 
Controlul procesului de accesare cu crawlere ar trebui să fie o prioritate maximă pentru webmasteri. Webmasterii pot crea priorități pentru fiecare dintre paginile lor. De exemplu, o pagină de pornire poate avea o prioritate de 100%, în timp ce documentele de nivel scăzut pot avea o prioritate de 60%. Această flexibilitate este benefică în definirea valorii site-ului dvs., pagină cu pagină.
- Descoperiți mai multe pagini. Sitemap-urile valide ajută roboții de accesare cu crawlere să descopere mai multe pagini, ceea ce înseamnă că mai mult conținut devine indexat.
 
Sitemaps-urile nu garantează rezultate de căutare mai înalte, doar că este descoperit mai mult din conținutul site-ului.
O altă caracteristică esențială, sitemaps-urile protejează împotriva conținutului duplicat. Este frustrant să publici un conținut original mai târziu pentru a găsi același conținut pe site-ul unui concurent.
Dacă sunt găsite două bucăți de conținut identice, motoarele încearcă să păstreze originalul și să arunce duplicatul. Motoarele de căutare vor accesa cu crawlere un site mai des dacă este utilizată o hartă a site-ului validă. Ei nu primesc întotdeauna apelul potrivit pe original, dar aveți protecție.
- Legături. Motoarele de căutare, în principal Google, pot adăuga link-uri suplimentare către un site web dacă acesta include o hartă a site-ului. Algoritmul Google poate adăuga linkuri valoroase sub lista organică a site-ului, oferind utilizatorilor o imagine mai completă a interogării. Acest proces este automatizat; cu toate acestea, șansele sunt mai mari dacă un site web are o hartă a site-ului.
 
- Erorile sunt minimizate. Erorile de crawling sunt evidențiate; dacă oferiți Google locația unui sitemap valid, motorul de căutare vă întoarce favoarea, oferind webmasterilor informații despre accesarea cu crawlere. Utilizați Google Search Console și Bing Webmaster pentru a trimite orice sitemap.
 
Boții accesează cu crawlere site-ul și raportează descoperirile lor. Această resursă este de neprețuit pentru cele mai bune practici SEO.
Diib: Obțineți cele mai recente valori pe harta dvs. XML de site
SEO începe la nivelul granular al unui site web în directorul rădăcină. Webmasterii ar trebui să înțeleagă ierarhia fiecărui site și pagină și să le construiască având în vedere motoarele de căutare. Diib Digital oferă cele mai cuprinzătoare și actualizate valori privind sănătatea sitemap-ului dvs. XML și vă va avertiza cu privire la posibile probleme cu mult înainte ca acestea să vă afecteze grav clasarea sau traficul. Iată câteva dintre caracteristicile tabloului nostru de bord pentru utilizatori care vă vor plăcea:
- Urmărirea sitemapului și sănătatea
 - Monitorizare domeniu 24/7
 - Repararea ratei de respingere
 - Performanță post
 - Pagini sparte în care aveți backlink (verificator 404)
 - Instrumente de monitorizare și urmărire a cuvintelor cheie, backlink și indexare
 - Experiența utilizatorului și optimizarea vitezei mobile
 
Obțineți o scanare gratuită a site-ului timp de 60 de secunde sau pur și simplu sunați la 800-303-3510 pentru a vorbi cu unul dintre experții noștri în creștere.
