Paginarea – un element crucial al indexării motoarelor de căutare
Publicat: 2017-11-08Cuprins
Ghidurile SEO privind paginarea, de exemplu, a categoriilor de magazine online sau a articolelor de blog, sunt un subiect recurent și există câteva abordări ale acestuia. Vom discuta despre cum să abordăm paginarea pentru a ajuta crawlerele web să proceseze conținutul mai ușor.
Ce este paginarea?
Paginarea înseamnă pur și simplu împărțirea unei anumite resurse de pe un site web în pagini. Cel mai simplu exemplu pot fi categoriile din majoritatea magazinelor online unde, după ce a enumerat un anumit număr de produse, utilizatorul poate merge la următoarea parte a listei de produse. O altă modalitate de a prezenta produse în cadrul unei categorii este paginarea cu derulare infinită, unde atunci când utilizatorul derulează în jos, sunt afișate produse noi și noi. La fel este și pentru bloguri. În general, nu contează ce resursă a unui site web este împărțită în părți, este mai mult despre cum o faci și cum notifică Googlebot despre conținutul care urmează.
Lăsați crawlerele web să facă ceea ce fac
Una dintre greșelile de bază comise în timpul paginarii este utilizarea etichetelor canonice pe prima pagină de paginare. Și chiar dacă este justificat într-o situație, de obicei este făcut incorect.
Dacă, de exemplu, o categorie de produse este împărțită în câteva pagini, înseamnă că pagina de bază include un anumit număr de produse, a doua pagină include un alt grup de produse și așa mai departe și așa mai departe, până la ultima pagină de paginare.
Paginile de paginare sunt după cum urmează:
https://website.com/ product-category/page-2
https://website.com/ product-category/page-3
https://website.com/product-category/page-4
etc.
prin urmare, nu are prea mult sens să folosești astfel de legături canonice:
<link rel="canonical" href="https://website.com/product-category" />
datorită faptului că este o parte suplimentară a produselor dintr-o anumită categorie, paginile 2,3,4 etc. nu sunt duplicate ale paginii principale (cu excepția cazului în care nu este cazul, atunci utilizarea unui link canonic este rezonabilă) .
Desigur, puteți furniza link-uri canonice, dar către ei înșiși . Într-un astfel de caz, introduceți următoarele pe pagina https://website.com/product-category/ :
<link rel="canonical" href="https://website.com/product-category" />
și următoarele pe pagina https://website.com/product-category/page-2:
<link rel="canonical" href="https://website.com/product-category/page-2" />
O pagină cu tot conținutul
Există o excepție – o pagină de bază cu tot conținutul , împărțită suplimentar în câteva subpagini cu mai puțin conținut. Într-o astfel de situație, este logic să folosiți o legătură canonică. Este o practică folosită des în articole destul de lungi și cu mult conținut.
Astfel, următoarele pagini:
https://website.com/product-category/page-1
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
combinate într-o singură secvență logică va include de fapt tot conținutul de pe pagina de bază https://website.com/product-category/ pe care doriți să îl utilizați pentru indexarea motoarelor de căutare.
Această primă pagină de paginare nefericită...
O altă greșeală este duplicarea paginii de bază a categoriei https://website.com/product-category/ cu prima pagină de paginare https://website.com/product-category/page-1
Dacă pagina de bază include același conținut ca /page-1, atunci este inutil să faceți o duplicare - anumite sisteme de management al conținutului generează în mod normal (pe lângă o pagină de bază) prima pagină de paginare care începe cu /page-1; într-un astfel de caz , adresa ar trebui, de exemplu, să fie redirecționată către pagina de bază folosind Redirect 301 , iar în cod ar trebui să furnizați un link nu către https://website.com/product-category/page-1, ci mai degrabă către https://website. com/categoria-produs/
În caz contrar, veți întâmpina o problemă de redirecționare internă, irosind astfel bugetul de accesare cu crawlere al Googlebot pentru accesarea cu crawlere a unui anumit site web. Cu alte cuvinte, nu are rost să-l redirecționați cu un link intern folosind Redirecționarea 301 când puteți conecta direct la pagina de destinație folosind codul de stare HTTP 200.
Atributele rel=“next”andrel=“prev”.
Dacă decideți să paginați după cum urmează:
https://website.com/product-category/
https://website.com/product-category/page-2
https://website.com/product-category/page-3
https://website.com/product-category/page-4
apoi puteți indica relațiile dintre paginile individuale unui crawler. Furnizarea de linkuri relevante cu atribute rel în secțiunea <head> evidențiază paginile individuale ale unei secvențe.
Pe prima pagină (de bază) , puneți următoarele:
<link rel="next" href="https://website.com/product-category/page-2">
ca o altă pagină care conține o parte din aceeași resursă.
Pe pagina următoare , adică https://website.com/product-category/page-2, puneți următoarele:
<link rel="prev" href="https://website.com/product-category/"> <link rel="next" href="https://website.com/product-category/page-3">
Mergând mai departe, pe a treia pagină, adică https://website.com/product-category/page-3:
<link rel="prev" href="https://website.com/product-category/page/page-2"> <link rel="next" href="https://website.com/product-category/page-4">
Presupunând că /page-4 este ultima din secvența de paginare , puneți acolo următoarele:
<link rel="prev" href="https://website.com/product-category/page-3">
Este cea mai folosită combinație de linkuri dintr-un titlu cu atribute „rel next/prev”. Uneori sunt adăugate atribute la link-urile „<a href=" în cod (de exemplu, sub listă), deși este mai bine să le puneți în secțiunea <head> - cu cât un crawler obține mai devreme un indiciu unde se află restul resursei , cu atât mai bine.

Trebuie să rețineți că linkurile cu atributele „rel next/prev” nu sunt directive absolute , adică pot, dar nu trebuie să fie luate în considerare atunci când accesați cu crawlere un site web. În plus, merită să folosiți căi absolute către paginile următoare, deși ghidurile Google spun că „valorile pot fi căi absolute și căi relative”. Totuși, în cazul unei pagini cu parametri într-o adresă URL, de exemplu parametrii de sortare, aceștia ar trebui să fie plasați și în link-urile „rel next/prev” – de exemplu, următoarea pagină:
https://website.com/product-category/page-3&sort=desc
va include următoarele linkuri în secțiunea <head>:
<link rel="prev" href="https://website.com/product-category/page-2&sort=desc"> <link rel="next" href="https://website.com/product-category/page-4&sort=desc">
dar o etichetă canonică care indică numai la sine (fără parametrul de sortare în ordine descrescătoare):
<link rel="canonical" href="https://website.com/product-category/page-3"/>
A indexa sau a nu indexa?
O altă problemă cu care se confruntă în timpul paginarii este utilizarea greșită a meta-etichetelor roboților. Google a susținut că paginile individuale trebuie considerate ca o secvență logică care va avea ca rezultat luarea în considerare a atributelor linkurilor lor și, în majoritatea cazurilor, va ajuta utilizatorul să afișeze prima pagină.
Foarte des se întâmplă ca paginile individuale de paginare, în ciuda faptului că sunt conectate între ele cu legături cu atribute „rel next/prev”, se află în indexul motorului de căutare. Dacă aveți o problemă cu aceasta, cel mai bine va fi să utilizați următoarele:
<meta name="roboți" content="noindex, follow" />
pe paginile următoare, adică pe /pagina-2 și mai sus. Un crawler web va accesa cu crawlere linkurile până la ultima pagină paginată, dar nu le va indexa.
Deci ce zici de canonici?
Din discuția cu John Mueller (https://plus.google.com/+JohnELincoln/posts/TCJHwdZHdQc) rezultă clar că nu ar trebui să combinați metaetichetele „fără index” cu etichetele canonice care indică către o adresă URL indexabilă. Prin urmare, în acest caz, dacă un link canonic de pe o pagină de paginare se direcționează către sine, o metaetichetă „fără index” nu trebuie pusă și invers.
Nu am observat probleme la accesarea cu crawlere a paginilor paginate cu link-uri canonice către paginile în sine și metaeticheta „fără index”; cu toate acestea, Google vrea să decidă singur ce să indexeze și ce să nu indexeze, așa că poate ar trebui să lăsăm Google să o facă.
Paginare și o hartă XML a site-ului web
Iată un caz interesant: mai degrabă nu introduceți linkuri de paginare într-un sitemap.xml, ci doar adresa de bază a, de exemplu, a unei categorii sau a articolului principal cu tot conținutul. În principiu, într-un sitemap XML ar trebui să fie introduse acele adrese pe care doriți să le indexați, așa că dacă nu vă pasă de indexarea paginației, nu includeți acolo URL-uri către /page-2 și mai sus. Desigur, dacă îl blocați cu o metaetichetă de roboți „fără index”, este și mai simplu – nu le furnizați.
Paginare pagini ca parametri
Dacă doriți să susțineți indexarea produselor/articolelor din ultima pagină paginată, oferiți crawlerelor web acces nelimitat la paginile altor categorii dincolo de categoria de bază. Este adesea cazul ca paginile individuale să aibă parametri „ ?page= ” sau „ ?p= ” și pot fi blocate din greșeală în robots.txt împreună cu restul parametrilor.
Este similar pentru parametrii URL din Google Search Console . Merită să arătăm Googlebot că astfel de parametri sunt responsabili pentru împărțirea resurselor în pagini și pentru a lăsa botul să decidă.
Paginarea și descrierile categoriilor
O practică frecvent urmată este extinderea conținutului categoriei, de exemplu în magazinele online. Se întâmplă adesea ca o descriere adăugată să fie afișată la toate adresele URL de paginare într-o formă neschimbată. Dacă toate paginile sunt tratate ca o secvență logică și combinate într-un întreg prin atributele „rel next/prev”, atunci pare inutil să duplicați același text pe /page-2, /page-3 etc.
Este similar în ceea ce privește produsele listate: fiecare pagină ulterioară afișează un nou set de produse, iar utilizatorul nu dorește nici să citească aceeași descriere a categoriei tot timpul pe fiecare pagină și nici să privească aceleași produse mai departe în cadrul categoriei. . Există totuși o întrebare – cine citește descrierile categoriilor? Googlebot probabil că o face, așa că nu-l alimentați cu duplicate.
Ai nevoie de paginare dacă folosești un scroll infinit?
Se dovedește că paginarea este o opțiune viabilă și în soluția 'infinite scroll', unde prin derularea în jos a listei de produse/articole din cadrul unei categorii sunt afișate noi resurse. John Mueller (http://scrollsample.appspot.com/items) a oferit un exemplu sensibil: în timp ce derulați lista, noi parametri care indică paginile ulterioare sunt adăugați la adresa URL.
http://scrollsample.appspot.com/items?page=2
http://scrollsample.appspot.com/items?page=3
și așa mai departe și așa mai departe.
Evident, aici sunt folosite link-uri cu atribute „rel next/prev” și se oferă o legătură canonică către ea însăși; de exemplu, la http://scrollsample.appspot.com/items?page=5, este următorul:
<link rel="canonical" href="/items?page=5" /> <link rel="next" href="/items?page=6"/> <link rel="prev" href="/items?page=4"/>
Paginarea ca element al unei strategii de indexare
Decizia de a aplica o anumită soluție de paginare vă aparține în mod natural. Exemplele de mai sus nu sunt opțiuni perfecte în orice situație deoarece puteți întâmpina dificultăți tehnice, probleme CMS sau pur și simplu este contrar unei strategii de indexare adoptate. Cu toate acestea, merită să optimizați paginarea într-o asemenea măsură încât cel puțin să nu împiedice Googlebot să acceseze cu crawlere site-ul web, precum și să promovăm indexarea paginilor de produse/articole îngropate, care nu sunt atât de ușor accesibile în timpul unei singure vizite.
