Cum evit conținutul duplicat?
Publicat: 2020-10-13În calitate de proprietar al site-ului web, este important să înțelegeți cum să evitați conținutul duplicat, deoarece acest tip de conținut este adesea un semn al site-urilor web de calitate scăzută și „spam”. Conținutul duplicat vă poate costa mult dacă doriți să vă creșteți proeminența pe Google și alte motoare de căutare.
Una dintre cele mai bune modalități de a vă marca afacerea online este dezvoltarea constantă a conținutului unic, de top și credibil pentru publicul dvs. - conținut care oferă valoare.
În timp ce motoarele de căutare adoră conținutul proaspăt, nu le plac site-urile web cu conținut duplicat. Ori de câte ori trimiteți conținut duplicat, forțați motoarele de căutare să decidă care dintre paginile/site-urile dvs. ar trebui să primească credit pentru conținutul publicat. Motoarele de căutare ar putea să nu reușească să clasifice sau să indexeze unele dintre site-urile web cu conținut duplicat, motiv pentru care trebuie să evitați conținutul duplicat intern și conținutul duplicat pe mai multe domenii.
În această postare, vom analiza cea mai bună modalitate de a detecta și de a evita dublarea. Citiți mai departe pentru a afla mai multe.
Ce este conținutul duplicat?
Subiectul conținutului duplicat încurcă de obicei mulți oameni. Potrivit Google Search Console, „Conținutul duplicat se referă, în general, la blocuri substanțiale de conținut din sau între domenii, care fie se potrivesc complet cu alt conținut, fie sunt considerabil similare. În mare parte, acest lucru nu este înșelător la origine.”
Conținut duplicat este un termen folosit în mod obișnuit de către marketerii de conținut care folosesc tehnici SEO pentru a-și promova site-urile. Termenul se referă la situații în care pagini web diferite, în cadrul sau între domenii, par să conțină conținut foarte similar sau identic. Proprietarii de site-uri web sunt uneori tentați să copieze și să lipească conținut în diferite pagini din site-ul lor pentru a-și popula paginile web.
Orice conținut duplicat va afecta campania SEO a site-ului dvs., deoarece acest tip de conținut compromite experiența unui utilizator. Întrucât scopul tău final este să ajungi pe poziția numărul 1 în paginile cu rezultate ale motoarelor de căutare (SERP), eforturile tale pot fi irosite dacă nu produci conținut unic, de înaltă calitate și fără plagiat.
REALITATE: Crearea de conținut îmbunătățește ratele de indexare cu peste 434%.
Tipuri de conținut duplicat
De obicei, există două categorii mari de conținut duplicat:
- Conținut duplicat intern: aici un nume de gazdă/domeniu are conținut duplicat în cadrul aceluiași site web și are mai multe adrese URL interne. Conținutul duplicat este limitat la domeniul site-ului dvs.

- Conținut duplicat pe mai multe domenii : Cunoscut și ca conținut duplicat pe mai multe domenii, acest tip de conținut apare atunci când mai multe domenii au același conținut clasat de motoarele de căutare.
Impactul conținutului duplicat asupra SEO
Experții SEO știu că informațiile care au fost replicate pe diverse domenii sunt rareori concentrate pe client. Mai mult, scopul multor motoare de căutare este de a returna pagini de rezultate de înaltă calitate pentru utilizatorii săi. Dacă motoarele de căutare, cum ar fi Google, nu urmăresc să satisfacă nevoile utilizatorilor lor, utilizatorii vor căuta alternative.
Deși Google nu impune penalități pentru conținutul duplicat, campania SEO a site-ului tău va fi afectată negativ, deoarece Google filtrează informații identice sau aproape similare.
Ce înseamnă asta pentru site-ul tău?
Pentru mulți experți SEO, filtrarea este o penalizare pentru site-ul dvs., deoarece este o pierdere a indexării conținutului dvs. web. Indiferent de cine a produs conținutul, există șanse mari ca pagina web originală să nu fie selectată pentru clasare în primele rezultate ale căutării Google.
Potrivit lui Dan Petrovic de la Dejan Marketing, „Dacă există mai multe instanțe ale aceluiași document pe web, URL-ul cu cea mai înaltă autoritate devine versiunea canonică. Restul sunt considerate duplicate.
Cum apar problemele de conținut duplicat?
Există multe cauze ale conținutului duplicat, majoritatea fiind tehnice. Este esențial să identificați și să remediați aceste probleme înainte ca acestea să poată afecta grav clasamentul dvs.
Vei fi interesat
Tendințe ale pieței de îmbrăcăminte pentru comerțul electronic în 2021
De ce este important SEO organic și cum să-l obțineți
Care este rata medie de conversie pentru un site web?
Comparați SEO site-ul dvs. cu concurenții dvs
Ce este SEO on-Page?
Cum se face SEO?
În afară de conținutul copiat, iată câteva dintre principalele cauze ale conținutului duplicat:
Structura URL
Diferitele motoare de căutare au reguli diferite privind structurile URL. Deși adresele URL sunt sensibile la majuscule și minuscule pentru Google, ele nu sunt sensibile la majuscule pentru Bing.
- De exemplu: https://yourdomainname.com/url-r/ este același cu https://yourdomainname.com/url-R/ pentru Bing. Cu toate acestea, aceste adrese URL sunt văzute ca fiind diferite de motorul de căutare Google.
Trebuie să fiți foarte conștienți atunci când creați link-uri pentru conținutul dvs. În caz contrar, o greșeală de tipar poate duce la ambele versiuni ale adresei URL să nu fie clasate.
Ordinea parametrilor
În cazurile în care un sistem de management al conținutului (CMS) nu folosește o adresă URL curată și plăcută, adrese URL diferite pot afișa pagini de rezultate similare pentru majoritatea site-urilor, dar clasate ca unice pe motoarele de căutare.
- De exemplu, adresele URL dezordonate, cum ar fi: /?id=3&cat=4 și /?id=4&cat=3 pot da rezultate similare în sistemele de site-uri web, deși sunt adrese URL diferite pentru motoarele de căutare.
Pagini pentru imprimantă
Site-ul dvs. are pagini care pot fi imprimate? Dacă da, ai un link către acele pagini din paginile tale de conținut/articol? Trebuie să te întrebi care dintre cele două versiuni vrei cu adevărat să arate Google?
Legăturile către pagini care pot fi imprimate pot fi în detrimentul SEO al site-ului dvs., deoarece Google localizează de obicei paginile care pot fi imprimate și le clasifică ca, ați ghicit, conținut duplicat. Iată o ilustrare bună pentru asta:

(Credit imagine: tronicglobal)
Pagini index
Dacă pagina de pornire a site-ului dvs. este configurată greșit, oamenii pot ajunge la site-ul dvs. prin mai multe adrese URL. Configurarea greșită se întâmplă de obicei fără știrea dvs. Dacă adresa URL a paginii de pornire a site-ului dvs. este https://yourdomainname.com, este important să rețineți că aceasta poate fi accesată prin alte adrese URL, cum ar fi:
- https://yourdomainname.com/index.asp
- https://yourdomainname.com/index.html
- https://yourdomainname.com/index.php
- https://yourdomainname.com/index.aspx
Pentru a evita astfel de cazuri, acordați-vă timp pentru a selecta cea mai bună modalitate de a vă difuza pagina de pornire.
Testează-ți SEO în 60 de secunde!
Diib este unul dintre cele mai bune instrumente SEO din lume. Diib folosește puterea datelor mari pentru a vă ajuta să vă creșteți rapid și ușor traficul și clasamentele. Vă vom anunța chiar dacă meritați deja să vă clasați mai sus pentru anumite cuvinte cheie.
- Instrument SEO automatizat ușor de utilizat
- Monitorizare cuvinte cheie și backlink + idei
- Viteză, securitate, + urmărire Core Vitals
- Sugerează în mod inteligent idei pentru a îmbunătăți SEO
- Peste 250.000 de mii de membri la nivel mondial
- Benchmarking și analiză a concurenței încorporate
Folosit de peste 250.000 de companii și organizații:
Se sincronizează cu 
WWW vs. NON-WWW sau HTTP vs. HTTPS
Deși această problemă apare rar în zilele noastre, unii proprietari de site-uri web încă au o problemă cu difuzarea conținutului lor. Dacă utilizați HTTPS și subdomeniul WWW, preferați să vă difuzați paginile web sub forma:
https://WWW.yourdomainname.com
Cu toate acestea, în cazurile în care serverul dvs. web este configurat incorect, articolele dvs. pot fi accesate prin adrese URL diferite, cum ar fi:
https://yourdomainname.com sau http://yourdomainname.com sau http://www.yourdomainname.com
Pagini dedicate pentru imagini
Site-ul dvs. web arată imagini pe o pagină goală? Ei bine, CMS-ul tău poate crea uneori pagini diferite pentru fiecare imagine pe care o folosești în conținutul tău. Deoarece astfel de pagini nu au niciun conținut, sunt similare cu alte pagini de imagini de pe internet. Ca atare, ele sunt văzute ca conținut duplicat de motoarele de căutare.
Sindicarea conținutului
Acest lucru se întâmplă destul de des, mai ales dacă site-ul dvs. este popular într-o anumită nișă. Uneori, blogurile sau site-urile care oferă bunuri și servicii similare (la fel ca și dvs.) vă pot folosi conținutul. De obicei, sindicarea conținutului are loc fără consimțământul dvs., deși alți proprietari de site-uri web pot cere să vă folosească conținutul din diverse motive.
Dacă conținutul republicat nu face legătura cu site-ul dvs., este posibil ca motoarele de căutare să nu cunoască sursa articolului.
Pagini cu rezultate ale căutării
Site-ul dvs. web permite probabil vizitatorilor să caute informații în pagina dvs. de pornire. Aceasta înseamnă că rezultatele căutării afișate pe aceste pagini sunt mai mult sau mai puțin aceleași și nu oferă nicio valoare motoarelor de căutare. Pentru a evita acest lucru, este important să nu legați conținutul site-ului dvs. la paginile cu rezultatele căutării.
ID-uri de sesiune
Destul de des, poate doriți să urmăriți vizitatorii site-ului dvs. Pentru a realiza acest lucru, trebuie să oferiți vizitatorilor o „sesiune”. Deci, ce este o sesiune?

O sesiune este istoricul vizitatorilor site-ului dvs. Vă spune activitățile vizitatorilor de pe site-urile dvs., cum ar fi numărul de articole introduse în coșul de cumpărături față de cele cumpărate. Pentru ca un site web să mențină o sesiune pe măsură ce vizitatorii se deplasează de la o pagină la alta, este utilizat un ID de sesiune.

(Credit imagine: tronicglobal)
ID-urile de sesiune sunt de obicei stocate sub formă de cookie-uri. Cu toate acestea, motoarele de căutare nu stochează niciodată cookie-uri. Acest lucru duce la confuzie de către motoarele de căutare între un ID de sesiune și adresa URL a acestuia. La rândul său, le percepe ca pe un conținut duplicat.
Cum să identifici conținutul duplicat
Nu este ușor să identifici conținut duplicat pe site-ul tău. Pentru a afla dacă conținutul site-ului dvs. este copiat, accesați cardurile „titlu de conținut” și „Meta informații”. Veți găsi informații referitoare la pagina dvs. de titlu, descrierea meta și titlurile H1.
Pentru conținut duplicat în afara site-ului dvs., încercați să căutați conținut deja publicat pe site-ul dvs. De exemplu, dacă doriți să vedeți dacă există conținut duplicat pentru acest articol „Cum să evitați conținutul duplicat”, puteți căuta cuvintele „Pentru conținut duplicat în afara site-ului dvs., încercați să căutați conținut deja publicat pe site-ul dvs.”. Sau „Care dintre acestea este o soluție posibilă pentru a rezolva problema conținutului duplicat?” (Folosită la sfârșitul acestei postări).
Deoarece probabil că veți publica mult conținut pe site-ul dvs. web, este recomandabil să verificați din nou conținutul cu instrumentele Google de verificare a conținutului duplicat pentru a vă asigura că conținutul este unic. Iată un exemplu de rezultate pe care v-ați aștepta să le vedeți de la acel instrument:


(Credit imagine: Moz)
Iată câteva instrumente pe care le puteți folosi pentru a verifica dacă există conținut duplicat și pentru a vă economisi timp.
Sperăm că ați găsit acest articol util.
Dacă doriți să aflați mai multe despre sănătatea site-ului dvs., primiți recomandări și alerte personale, scanați-vă site-ul de către Diib. Durează doar 60 de secunde.
Copyscape
Copyscape este un instrument larg recunoscut pentru verificarea conținutului duplicat. Are un instrument de comparare care evidențiază orice conținut duplicat din text. Lucrul bun cu Copyscape este că instrumentul îți oferă rezultate în doar câteva secunde și vei cunoaște procentul exact din textul tău care a fost deja publicat.
Siteliner
Ocazional, ar putea fi necesar să verificați conținutul duplicat pentru întregul site. Siteliner este un instrument excelent pentru a verifica întregul site nu numai pentru conținut duplicat, ci și pentru link-uri rupte și pentru a identifica paginile web care sunt bine clasate de motoarele de căutare.
Duplichecker
Duplichecker este un instrument care vă verifică conținutul pentru plagiat. Site-ul vă permite să vă verificați conținutul în căutări DocX, fișier text sau URL. Înainte de a vă înscrie, aveți voie să faceți o singură căutare gratuită pe zi, limita fiind de până la 50 de căutări după înscriere.
PlagSpotter
Căutarea URL PlagSpotter este eficientă, gratuită și oferă rezultate în câteva secunde. Rezultatele scanării URL includ link-uri către sursele conținutului duplicat. Ca atare, vă puteți compara textul cu conținut similar online.
Instrumentul vă poate monitoriza automat site-ul web în fiecare săptămână.
Eliminarea conținutului duplicat
Găsirea de soluții pentru conținutul dvs. web va îmbunătăți considerabil SEO-ul site-ului dvs., mai ales dacă aveți o afacere online. Pentru eliminarea eficientă a conținutului duplicat, iată câteva lucruri pe care le puteți face.
Eliminați dublările inutile
Deși necesită foarte mult timp, primul și cel mai simplu mod de a elimina conținutul duplicat este prin rescrierea informațiilor sau articolelor. Luați-vă timp și citiți conținut similar online, acestea pot fi mai multe site-uri web care acoperă același subiect și apoi puneți ideile pe care le-ați citit în propriile cuvinte. Și nu ezitați să adăugați mai multe informații și să utilizați diferite dispozitive de încadrare pentru a vă asigura că conținutul pe care îl produceți este 100% unic.
Utilizați o redirecționare 301
În câteva cazuri, este posibil să vă fie imposibil să împiedicați complet CMS-ul dvs. să creeze adrese URL multiple sau greșite pentru conținutul dvs. În cele mai multe cazuri, este posibil să redirecționați adrese URL greșite. O redirecționare face ca un browser să se schimbe de la o adresă URL la alta, fie pe același site web, fie pe mai multe site-uri web. Acesta este un exemplu de redirecționare 301:

Verificați repetiția standard
Platele lungi nu trebuie folosite pe pagini diferite din cadrul aceluiași site web. Mai degrabă, ar trebui să fie folosite pe o singură pagină. De exemplu, în loc să utilizați o notificare lungă privind drepturile de autor în partea de jos a fiecărei pagini, scrieți un rezumat al notificării și legați-l la o pagină cu mai multe informații.
Noindex Metaetichetă
După cum sa menționat mai devreme, alți proprietari de site-uri web vă pot copia conținutul fără știrea dvs. Deoarece s-ar putea să nu evitați astfel de lucruri, includeți o notă mică pe pagina de conținut, de obicei în partea de jos. Cereți celor care ar putea folosi conținutul dvs. să folosească o metaetichetă „noindex” pentru a preveni clasarea oricărui conținut duplicat de către Google sau alte motoare de căutare.
Evitați publicarea stuburilor
Cum te-ai simți dacă ai deschide o pagină de site și ai găsi doar câteva cuvinte și câteva pagini goale? Probabil ai fi șocat. În cele mai multe cazuri, veți descoperi că proprietarii de site-uri web încă nu au publicat conținut pe astfel de pagini. Acest lucru poate fi dăunător, deoarece Google va clasifica toate paginile goale ca având conținut duplicat.
Ori de câte ori doriți să creați o pagină de substituent, utilizați întotdeauna metaetichete noindex pentru a preveni indexarea acestor pagini.
Utilizați o singură adresă URL
Deși puteți utiliza mai multe adrese URL pentru a face legătura către site-ul dvs. web, este important să alegeți o singură adresă URL. Rețineți clienții atunci când alegeți adresa URL, deoarece adresa URL trebuie să fie ușor de utilizat. O singură adresă URL facilitează nu numai Google să clasifice site-ul dvs. web, ci și utilizatorilor dvs. să vă localizeze site-ul sau o pagină.
Trebuie să setați standardul preferat ca WWW sau non-WWW. Ideea este de a evita crearea de confuzii utilizatorilor și motoarelor de căutare.
Utilizați o etichetă Hreflang
O etichetă hreflang utilizează o metaetichetă de semnal HTML care le spune oamenilor limba și/sau locația geografică a site-ului dvs. Hreflang este esențial pentru site-urile cu mai multe limbi. De exemplu, acest tip de etichetă face posibil acest lucru:

Catering pentru utilizatorii non-nativi ai motoarelor de căutare înseamnă că experiența lor pe site-ul dvs. este îmbunătățită.
Cu toate acestea, dacă aveți mai multe versiuni ale unei singure pagini în diferite limbi, trebuie să utilizați etichete hreflang pentru a informa Google sau alte motoare de căutare despre varianta.
Conectați întotdeauna înapoi la conținutul original
Care dintre acestea este o soluție posibilă pentru a rezolva problema conținutului duplicat? Ei bine, dacă nu puteți scăpa de conținutul duplicat din diverse motive, amintiți-vă întotdeauna să includeți un link către conținutul original. Acesta poate fi chiar sub sau deasupra conținutului duplicat.
Dacă motoarele de căutare întâlnesc mai multe link-uri de articole care indică conținutul dvs., vor descoperi că conținutul dvs. este versiunea originală sau canonică.
Cât de mult conținut duplicat este acceptabil?
Google recompensează doar conținutul unic care adaugă valoare clienților, ceea ce înseamnă că Google nu acceptă duplicarea conținutului. Cu toate acestea, răspunsul la întrebarea „cât de mult conținut duplicat este acceptabil de Google sau de alte motoare de căutare?” este încă discutabil pentru că niciun răspuns nu este perfect. Ca atare, folosiți întotdeauna un verificator de conținut duplicat Google și asigurați-vă că articolele sunt 100% înainte de a le publica. Acesta este modul în care motoarele de căutare determină conținutul duplicat:

(Credit imagine: www.elliance.com)
Diib: Îmbunătățește-ți clasamentul SEO evitând conținutul duplicat
Experții SEO vă vor avertiza împotriva conținutului duplicat - au dreptate. Deși conținutul duplicat apare aproape peste tot în zilele noastre, este important să fii cu ochii pe ceea ce vrei să publici pe site-ul tău dacă vrei să-ți îmbunătățești clasarea. Tabloul de bord al utilizatorului Diib este configurat pentru a identifica orice cazuri de conținut duplicat și pentru a vă trimite o alertă cu pași pentru remediere. Iată câteva dintre caracteristicile acelui tablou de bord pe care sigur le veți aprecia:
- Instrumentele de cercetare a concurenței pentru cuvinte cheie și backlink vă vor ajuta să găsiți cuvintele cheie pentru care se clasează concurenții dvs. și să creați conținut în jurul acestor cuvinte cheie.
- Valorile cheie, cum ar fi rata de respingere, conținutul duplicat și vizitatorii care revin, vă pot menține site-ul sănătos.
- Verificați cum le place utilizatorilor paginii dvs. de Facebook conținutul pe care îl distribuiți.
- Bucurați-vă de un apel lunar cu un expert în creștere Diib.
Faceți clic aici pentru o analiză gratuită a site-ului timp de 60 de secunde sau sunați la 800-303-3510 pentru a discuta cu un expert în creștere astăzi!
