Como evitar conteúdo duplicado?
Publicados: 2020-10-13Como proprietário de um site, é importante que você entenda como evitar conteúdo duplicado, pois esse tipo de conteúdo geralmente é um sinal de sites de baixa qualidade e “spam”. Conteúdo duplicado pode custar muito caro se você deseja aumentar sua proeminência no Google e em outros mecanismos de pesquisa.
Uma das melhores maneiras de divulgar sua empresa on-line é desenvolver consistentemente conteúdo exclusivo, de alto nível e confiável para seu público - conteúdo que agregue valor.
Enquanto os motores de busca adoram conteúdo novo, eles não gostam de sites com conteúdo duplicado. Sempre que você envia conteúdo duplicado, você está forçando os mecanismos de pesquisa a decidir quais de suas páginas/sites devem receber crédito pelo conteúdo publicado. Os mecanismos de pesquisa podem não classificar ou indexar alguns dos sites com conteúdo duplicado, e é por isso que você precisa evitar conteúdo duplicado interno e conteúdo duplicado entre domínios.
Neste post, veremos a melhor maneira de detectar e evitar a duplicação. Continue a ler para saber mais.
O que é conteúdo duplicado?
O tema de conteúdo duplicado costuma confundir muita gente. De acordo com o Google Search Console, “conteúdo duplicado geralmente se refere a blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são sensivelmente semelhantes. Principalmente, isso não é de origem enganosa.”
Conteúdo duplicado é um termo comumente usado por profissionais de marketing de conteúdo que usam técnicas de SEO para promover seus sites. O termo refere-se a situações em que diferentes páginas da Web, dentro ou entre domínios, parecem conter conteúdo muito semelhante ou idêntico. Às vezes, os proprietários de sites são tentados a copiar e colar conteúdo em diferentes páginas do site para preencher suas páginas da web.
Qualquer conteúdo duplicado prejudicará a campanha de SEO do seu site, pois esse tipo de conteúdo compromete a experiência do usuário. Como seu objetivo final é chegar à posição número 1 nas páginas de resultados dos mecanismos de pesquisa (SERP's), seus esforços podem ser desperdiçados se você não produzir conteúdo exclusivo, de alta qualidade e livre de plágio.
FATO: A criação de conteúdo melhora as taxas de indexação em mais de 434%.
Tipos de conteúdo duplicado
Normalmente, existem duas grandes categorias de conteúdo duplicado:
- Conteúdo duplicado interno: é onde um nome de host/domínio tem conteúdo duplicado no mesmo site e possui vários URLs internos. O conteúdo duplicado é limitado ao domínio do seu site.

- Conteúdo duplicado entre domínios: também conhecido como conteúdo duplicado entre domínios, esse tipo de conteúdo ocorre quando vários domínios têm o mesmo conteúdo classificado pelos mecanismos de pesquisa.
Impacto do conteúdo duplicado no SEO
Os especialistas em SEO sabem que as informações que foram replicadas em vários domínios raramente são focadas no cliente. Além disso, o objetivo de muitos mecanismos de pesquisa é retornar páginas de resultados de alta qualidade para seus usuários. Se os mecanismos de busca, como o Google, não visam atender às necessidades de seus usuários, os usuários buscarão alternativas.
Embora o Google não imponha penalidades sobre conteúdo duplicado, a campanha de SEO do seu site será afetada negativamente, pois o Google filtra informações idênticas ou quase semelhantes.
O que isso significa para o seu site?
Para muitos especialistas em SEO, a filtragem é uma penalidade para o seu site porque é uma perda de indexação para o seu conteúdo da web. Independentemente de quem produziu o conteúdo, há grandes chances de que a página da web original não seja selecionada para classificação nos principais resultados de pesquisa do Google.
De acordo com Dan Petrovic, da Dejan Marketing, “se houver várias instâncias do mesmo documento na web, a URL de autoridade mais alta se tornará a versão canônica. Os demais são considerados duplicatas.
Como ocorrem os problemas de conteúdo duplicado?
Existem muitas causas de conteúdo duplicado, sendo a maioria delas técnicas. É crucial que você identifique e corrija esses problemas antes que eles possam causar sérios danos à sua classificação.
Você vai se interessar
Tendências de tamanho do mercado de vestuário de comércio eletrônico em 2021
Por que o SEO orgânico é importante e como obtê-lo
Qual é a taxa de conversão média de um site?
Compare o SEO do seu site com seus concorrentes
O que é SEO On Page?
Como fazer SEO?
Além do conteúdo copiado, aqui estão algumas das principais causas de conteúdo duplicado:
Estrutura de URL
Diferentes mecanismos de pesquisa têm regras diferentes sobre estruturas de URL. Embora os URLs diferenciam maiúsculas de minúsculas para o Google, eles não diferenciam maiúsculas de minúsculas para o Bing.
- Por exemplo: https://yourdomainname.com/url-r/ é o mesmo que https://yourdomainname.com/url-R/ para Bing. No entanto, esses URLs são vistos como diferentes pelo mecanismo de pesquisa do Google.
Você precisa estar muito atento ao criar links para o seu conteúdo. Caso contrário, um erro de digitação pode fazer com que ambas as versões do seu URL não sejam classificadas.
Ordem dos Parâmetros
Nos casos em que um sistema de gerenciamento de conteúdo (CMS) não usa um URL limpo e agradável, URLs diferentes podem mostrar páginas de resultados semelhantes para a maioria dos sites, mas classificadas como exclusivas nos mecanismos de pesquisa.
- Por exemplo, URLs confusos como: /?id=3&cat=4 e /?id=4&cat=3 podem fornecer resultados semelhantes em sistemas de sites, embora sejam URLs diferentes para mecanismos de pesquisa.
Páginas amigáveis para impressão
Seu site tem páginas amigáveis para impressão? Em caso afirmativo, você vincula essas páginas a partir de suas páginas de conteúdo/artigo? É preciso se perguntar qual das duas versões você realmente deseja que o Google mostre?
Links para páginas amigáveis para impressão podem ser prejudiciais para o SEO do seu site porque o Google geralmente localiza páginas amigáveis para impressão e as classifica como, você adivinhou, conteúdo duplicado. Aqui está uma boa ilustração para isso:

(Crédito da imagem: tronicglobal)
Páginas de índice
Se a página inicial do seu site estiver configurada incorretamente, as pessoas poderão acessar seu site por meio de vários URLs. A configuração incorreta geralmente acontece sem o seu conhecimento. Se o URL da página inicial do seu site for https://yourdomainname.com, é importante observar que ele pode ser acessado por meio de outros URLs, como:
- https://seudominio.com/index.asp
- https://seudominio.com/index.html
- https://seudominio.com/index.php
- https://seudominio.com/index.aspx
Para evitar esses casos, reserve um tempo para selecionar a melhor maneira de veicular sua página inicial.
Teste seu SEO em 60 segundos!
Diib é uma das melhores ferramentas de SEO do mundo. A Diib usa o poder do big data para ajudá-lo a aumentar de forma rápida e fácil seu tráfego e classificações. Até mesmo informaremos se você já merece uma classificação mais alta para determinadas palavras-chave.
- Ferramenta de SEO automatizada fácil de usar
- Monitoramento de palavras-chave e backlinks + ideias
- Velocidade, segurança, + rastreamento de Core Vitals
- Sugere de forma inteligente ideias para melhorar o SEO
- Mais de 250.000 mil membros globais
- Benchmarking integrado e análise de concorrentes
Usado por mais de 250 mil empresas e organizações:
Sincroniza com 
WWW x NON-WWW ou HTTP x HTTPS
Embora esse problema raramente ocorra hoje em dia, alguns proprietários de sites ainda têm problemas com a veiculação de seu conteúdo. Se você estiver usando HTTPS e o subdomínio WWW, prefere servir suas páginas da web na forma de:
https://WWW.seudominio.com
No entanto, nos casos em que seu servidor web está configurado incorretamente, seus artigos podem ser acessados através de diferentes URLs, como:
https://yourdomainname.com ou http://yourdomainname.com ou http://www.yourdomainname.com
Páginas dedicadas para imagens
Seu site mostra imagens em uma página vazia? Bem, seu CMS às vezes pode criar páginas diferentes para cada imagem que você usa em seu conteúdo. Como essas páginas não possuem conteúdo, são semelhantes a outras páginas de imagens na internet. Como tal, eles são vistos como conteúdo duplicado pelos motores de busca.
Distribuição de conteúdo
Isso ocorre com bastante frequência, especialmente se o seu site for popular em um determinado nicho. Às vezes, blogs ou sites que fornecem bens e serviços semelhantes (assim como você) podem usar seu conteúdo. Normalmente, a distribuição de conteúdo ocorre sem o seu consentimento, embora outros proprietários de sites possam solicitar o uso de seu conteúdo por vários motivos.
Se o conteúdo republicado não estiver vinculado ao seu site, os mecanismos de pesquisa podem não saber a fonte do artigo.
Páginas de resultados de pesquisa
Seu site provavelmente permite que os visitantes pesquisem informações em sua página inicial. Isso significa que os resultados de pesquisa exibidos nessas páginas são mais ou menos os mesmos e não oferecem nenhum valor aos mecanismos de pesquisa. Para evitar isso, é importante que você não vincule o conteúdo do seu site às suas páginas de resultados de pesquisa.

IDs de sessão
Muitas vezes, você pode querer rastrear os visitantes do seu site. Para conseguir isso, você precisa dar aos seus visitantes uma “sessão”. Então, o que é uma sessão?
Uma sessão é o histórico dos visitantes do seu site. Ele informa as atividades dos visitantes em seus sites, como o número de itens colocados no carrinho de compras versus os comprados. Para que um site mantenha uma sessão à medida que os visitantes passam de uma página para outra, é usado um ID de sessão.

(Crédito da imagem: tronicglobal)
Os IDs de sessão geralmente são armazenados na forma de cookies. No entanto, os motores de busca nunca armazenam cookies. Isso leva à confusão dos mecanismos de pesquisa entre um ID de sessão e seu URL. Por sua vez, percebe-os como um conteúdo duplicado.
Como identificar conteúdo duplicado
Não é fácil identificar conteúdo duplicado em seu site. Para saber se o conteúdo do seu site foi copiado, acesse os cards “título de conteúdo” e “Metainformações”. Você encontrará informações relacionadas à sua página de título, Meta descrição e títulos H1.
Para conteúdo duplicado fora do seu site, tente pesquisar conteúdo já publicado em seu site. Por exemplo, se você quiser ver se há conteúdo duplicado para este artigo “Como evitar conteúdo duplicado”, você pode pesquisar as palavras “Para conteúdo duplicado fora do seu site, tente pesquisar conteúdo já publicado em seu site”. Ou “Qual destas é uma solução possível para lidar com o problema de conteúdo duplicado?” (Usado no final deste post).
Como você provavelmente publicará muito conteúdo em seu site, é aconselhável verificar novamente seu conteúdo com as ferramentas de verificação de conteúdo duplicado do Google para garantir que seu conteúdo seja exclusivo. Aqui está um exemplo dos resultados que você esperaria ver dessa ferramenta:


(Crédito da imagem: Moz)
Aqui estão algumas ferramentas que você pode usar para verificar se há conteúdo duplicado e economizar seu tempo.
Esperamos que você tenha achado este artigo útil.
Se você quiser saber mais sobre a saúde do seu site, obter recomendações e alertas pessoais, escaneie seu site pela Diib. Leva apenas 60 segundos.
Copyscape
Copyscape é uma ferramenta amplamente reconhecida para verificar conteúdo duplicado. Possui uma ferramenta de comparação que destaca qualquer conteúdo duplicado em seu texto. O bom do Copyscape é que a ferramenta te dá resultados em apenas alguns segundos, e você fica sabendo a porcentagem exata do seu texto que já foi publicado.
Siteliner
Ocasionalmente, pode ser necessário verificar o conteúdo duplicado de todo o site. O Siteliner é uma excelente ferramenta para verificar todo o seu site não apenas em busca de conteúdo duplicado, mas também de links quebrados e identificação de páginas da Web que são classificadas com destaque pelos mecanismos de pesquisa.
Verificador duplicado
Duplichecker é uma ferramenta que verifica seu conteúdo quanto a plágio. O site permite que você verifique seu conteúdo em pesquisas DocX, arquivo de texto ou URL. Antes de se inscrever, você só pode fazer uma pesquisa gratuita por dia, com o limite de até 50 pesquisas após a inscrição.
PlagSpotter
A pesquisa de URL do PlagSpotter é eficiente, gratuita e fornece resultados em poucos segundos. Os resultados de sua verificação de URL incluem links para as fontes do conteúdo duplicado. Como tal, você pode comparar seu texto com conteúdo semelhante online.
A ferramenta também pode monitorar automaticamente seu site toda semana.
Remoção de conteúdo duplicado
Encontrar soluções para o conteúdo da web melhorará muito o SEO do seu site, principalmente se você tiver um negócio online. Para uma remoção eficaz de conteúdo duplicado, aqui estão algumas coisas que você pode fazer.
Remover duplicação desnecessária
Embora muito demorado, a primeira e mais fácil maneira de remover conteúdo duplicado é reescrever suas informações ou artigos. Tome seu tempo e leia conteúdo semelhante on-line, podem ser vários sites que cobrem o mesmo tópico e, em seguida, coloque as ideias que você leu em suas próprias palavras. E sinta-se à vontade para adicionar mais informações e usar vários dispositivos de enquadramento para garantir que o conteúdo que você produz seja 100% exclusivo.
Use um redirecionamento 301
Em alguns casos, pode ser impossível impedir totalmente que seu CMS crie URLs múltiplos ou errados para seu conteúdo. Na maioria dos casos, é possível redirecionar URLs errados. Um redirecionamento faz um navegador mudar de um URL para outro, seja no mesmo site ou em vários sites. Este é um exemplo de um redirecionamento 301:

Verifique a repetição da placa de caldeira
Textos clichês longos não devem ser usados em páginas diferentes no mesmo site. Em vez disso, eles devem ser usados em uma página. Por exemplo, em vez de usar um longo aviso de direitos autorais na parte inferior de cada página, escreva um resumo do aviso e vincule-o a uma página com mais informações.
Metatag Noindex
Como dito anteriormente, outros proprietários de sites podem copiar seu conteúdo sem o seu conhecimento. Como você pode não evitar que essas coisas aconteçam, inclua uma pequena nota em sua página de conteúdo, geralmente na parte inferior. Peça àqueles que podem usar seu conteúdo para usar uma metatag “noindex” para evitar que qualquer conteúdo duplicado seja classificado pelo Google ou outros mecanismos de pesquisa.
Evite publicar stubs
Como você se sentiria se abrisse a página de um site e encontrasse apenas algumas palavras e várias páginas vazias? Você provavelmente ficaria chocado. Na maioria dos casos, você descobrirá que os proprietários de sites ainda não publicaram conteúdo nessas páginas. Isso pode ser prejudicial porque o Google classificará todas as páginas vazias como tendo conteúdo duplicado.
Sempre que você quiser criar uma página de espaço reservado, sempre use metatags noindex para evitar que essas páginas sejam indexadas.
Use apenas um URL
Embora você possa usar vários URLs para vincular seu site, é importante escolher apenas um URL. Lembre-se de seus clientes ao escolher seu URL, pois seu URL precisa ser amigável. Um único URL torna mais fácil não apenas para o Google classificar seu site, mas também para seus usuários localizarem seu site ou uma página.
Você precisa definir seu padrão preferido como WWW ou não WWW. A ideia é evitar criar qualquer confusão para seus usuários e mecanismos de busca.
Use uma tag Hreflang
Uma tag hreflang usa uma metatag de sinal HTML que informa às pessoas o idioma e/ou a localização geográfica do seu site. Hreflang é essencial para sites com vários idiomas. Por exemplo, este tipo de tag torna isso possível:

O atendimento a usuários de mecanismos de pesquisa não nativos significa que a experiência deles em seu site é aprimorada.
No entanto, se você tiver várias versões de uma única página em diferentes idiomas, deverá usar as tags hreflang para informar ao Google ou a outros mecanismos de pesquisa sobre a variação.
Sempre vincular de volta ao conteúdo original
Qual destas é uma solução possível para lidar com o problema de conteúdo duplicado? Bem, se você não conseguir se livrar do conteúdo duplicado por vários motivos, lembre-se sempre de incluir um link para o conteúdo original. Isso pode estar logo abaixo ou em cima do conteúdo duplicado.
Se os mecanismos de pesquisa encontrarem vários links de artigos que apontam para o seu conteúdo, eles descobrirão que seu conteúdo é a versão original ou canônica.
Quanto conteúdo duplicado é aceitável?
O Google recompensa apenas conteúdo exclusivo que agrega valor aos clientes, o que significa que o Google não aceita qualquer quantidade de duplicação de conteúdo. No entanto, a resposta para a pergunta “quanto conteúdo duplicado é aceitável pelo Google ou por outros mecanismos de pesquisa?” ainda é discutível porque nenhuma resposta é perfeita. Como tal, sempre use um verificador de conteúdo duplicado do Google e verifique se seus artigos estão 100% antes de publicá-los. É assim que os mecanismos de pesquisa determinam o conteúdo duplicado:

(Crédito da imagem: www.elliance.com)
Diib: Aumente seu ranking de SEO evitando conteúdo duplicado
Especialistas em SEO irão avisá-lo contra conteúdo duplicado – eles estão certos. Embora o conteúdo duplicado ocorra em quase todos os lugares hoje em dia, é importante que você fique de olho no que deseja publicar em seu site se quiser melhorar sua classificação. O Diib User Dashboard está configurado para detectar quaisquer casos de conteúdo duplicado e enviar um alerta com etapas para correção. Aqui estão alguns dos recursos desse painel que você certamente apreciará:
- As ferramentas de pesquisa de concorrentes de palavras-chave e backlinks ajudarão você a encontrar quais palavras-chave seus concorrentes estão classificando e criar conteúdo em torno dessas palavras-chave.
- As principais métricas, como taxa de rejeição, conteúdo duplicado e visitantes recorrentes, podem manter seu site saudável.
- Verifique como os seguidores da sua página do Facebook gostam do conteúdo que você compartilha.
- Desfrute de uma ligação mensal com um especialista em crescimento da Diib.
Clique aqui para uma análise gratuita do site em 60 segundos ou ligue para 800-303-3510 para conversar com um especialista em crescimento hoje!
