O que é um Sitemap XML e como criar um?

Publicados: 2020-11-20

Construir um site requer muita disciplina e curiosidade para que ele seja notado em um cenário de internet em constante expansão – um dos passos fundamentais para o sucesso do SEO é um mapa do site.

Um protocolo de mapa do site é um roteiro para o seu site. Sitemaps úteis permitem que os mecanismos de pesquisa rastreiem seu site com mais eficiência. O Google introduziu o protocolo pela primeira vez em 2005, permitindo que os desenvolvedores publicassem links de seus sites.

O suporte conjunto do Yahoo e da Microsoft veio em 2006 e, mais tarde naquele ano, Ask.com e IBM deram seu apoio ao novo protocolo. Um dos avanços significativos do protocolo foi a descoberta automática por meio do arquivo robots.txt.

O que é um mapa do site?

A função de um mecanismo de pesquisa é vasculhar a internet em busca de novos códigos e páginas da web. Uma segunda função é indexar o conteúdo e colocá-lo em uma hierarquia detectável — a peça final do quebra-cabeça; exibir conteúdo para consultas relevantes.

Sitemaps são a interface entre um site e os motores de busca. Um mapa do site do Google é uma extensão de arquivo XML que oferece aos webmasters a capacidade de informar aos robôs rastreadores sobre URLs novos e alterados. Sitemaps úteis informam aos bots quando a URL foi atualizada pela última vez e sua importância para outras URLs no site. É assim que um mapa do site pode se parecer:

O que é um Sitemap XML

(Crédito da imagem: DYNO Mapper)

Os humanos usam sitemaps como um marcador de SEO para seus sites. No entanto, deve ser totalmente entendido: um índice de mapa do site é para os bots de rastreamento do mecanismo de pesquisa. Qualquer coisa que os webmasters possam fazer para aumentar essa comunicação, melhor.

Os mecanismos de pesquisa enviam bots ou spiders rastreadores periodicamente para encontrar conteúdo atualizado. Bots são pequenos pedaços de código que fazem interface com o mecanismo e seu site. Quanto mais eficiente for o seu mapa do site, mais fácil será para um mecanismo de pesquisa descobrir e indexar novos conteúdos e links.

O rastreamento é o processo de bots visitando sites com base no algoritmo de frequência de um mecanismo de pesquisa e outros fatores. Os rastreadores usam links para descobrir outras páginas prestando muita atenção ao novo conteúdo e às alterações de assunto existentes.

O Google e outros mecanismos deram aos webmasters uma escolha granular quando o bot de pesquisa rastreia seus sites. Esse recurso é um avanço significativo para as políticas arcanas do passado.

Se você estiver configurando seu mapa do site do Google, há algumas condições que precisam ser seguidas:

  • A localização do seu mapa do site deve estar no diretório raiz do seu site. Os bots de rastreamento geralmente começam na raiz e se movem para fora. Se houver um mapa do site, você facilitou para o bot.
  • Em segundo lugar, cada URL subsequente deve ser igual ao mapa do site. Se o mapa do site tiver o protocolo HTTP:, cada URL deverá ter a mesma extensão HTTP:.
  • Os principais mecanismos de pesquisa agora permitem vários arquivos de mapa do site em um único diretório para facilitar o rastreamento. O número máximo de URLs permitidos em um único arquivo de sitemap é 50.000. Os webmasters podem dividir esse número ainda mais e ter vários sitemaps para definir melhor a estrutura do site.
  • Siga os formatos de mapa do site do Sitemaps.org para estabelecer o esquema certo para o seu site.

SEO e seu mapa do site

Todo site precisa de um mapa do site e do conhecimento de como criar mapas do site xml, sejam novos com uma única página ou uma loja de comércio eletrônico com milhares de produtos. Os sites se beneficiam quando os mecanismos de pesquisa podem encontrar facilmente páginas importantes e quando elas foram atualizadas pela última vez.

Um mapa do site na estrutura do seu site informa aos mecanismos de pesquisa que cada URL incluído é uma página de destino de qualidade.

As melhores práticas de SEO estão sempre em fluxo; o que foi excelente conselho ontem sobre como criar sitemap xml pode ter mudado hoje. É um conselho sábio saber a localização das melhores práticas de SEO para cada um dos mecanismos de pesquisa que seu site está segmentando.

Fique longe de opiniões amplificadas em blogs e fóruns. Concentre-se no que é essencial, como um google xml sitemap requisitos. Aproveite o tempo para disseminar o ruído e formar sua melhor prática dos principais motores.

Você vai se interessar

Formato de um Sitemap XML

  • org é a fonte definitiva do que é o protocolo xml do mapa do site e como estruturar um mapa do site. A formatação adequada de um sitemap XML consiste em uma série de tags descritivas. Cada valor deve ter escape de entidade, o que significa que o mapa do site é codificado em UTF-8. Por exemplo:

O que é um Sitemap XML

(Crédito da imagem: Sitemaps)

UTF-8 é a abreviação de Unicode Transformation Format-8 Bit. Esta designação representa uma largura variável padrão, caractere de comunicação eletrônica. Outra condição de formatação: cada URL do mapa do site deve ser codificado para legibilidade pelo servidor web.

Veja a seguir as definições de tags de sitemap; alguns são alguns dos requisitos do mapa do site xml do google, enquanto outros são opcionais.

  • <urlset> é uma tag obrigatória. Esta referência padrão; o que é o protocolo xml do sitemap e descreve o arquivo.
  • <url> é a tag pai para cada entrada. Cada tag após esta entrada é uma tag filha.
  • <loc> é outra tag obrigatória. Esse recurso faz referência à URL e começa com um protocolo como HTTP ou HTTPS e deve terminar com uma barra se o servidor da Web exigir. Esse valor deve ter menos de 2.048 caracteres.
  • <lastmod> é uma tag opcional que define quando o arquivo foi modificado pela última vez. A tag deve estar no formato W3C Datetime. A tag é separada da tag if-modified-since. Os mecanismos de pesquisa podem usar informações de fontes alternativas.
  • <changefreq> é outra tag opcional que melhora a capacidade de pesquisa do mapa do site. Essa tag exibe a frequência com que a página provavelmente será alterada.

Sempre, usado para descrever documentos que serão alterados cada vez que forem acessados:

  • De hora em hora
  • Diário
  • Semanalmente
  • Por mês
  • Anual
  • Nunca, URLs arquivados

Os rastreadores da Web podem acessar uma página com mais frequência do que de hora em hora e podem rastrear páginas marcadas anualmente com mais frequência. As páginas marcadas com nunca podem ser rastreadas para lidar com alterações inesperadas.

  • <priority> é uma tag de URL relativa a outras URLs no site. Os valores variam de 0,0 a 1,0, sendo o padrão 0,5. O valor não afeta como as páginas são comparadas a outros sites. A tag exibe os requisitos do mapa do site xml do google e quais páginas o webmaster considera mais importantes para os rastreadores.

As prioridades atribuídas provavelmente não influenciarão a posição de pesquisa. Os webmasters podem usar essa tag para aumentar a probabilidade de que as páginas mais importantes sejam indexadas.

Criar um mapa do site

Criar um índice de sitemap pode parecer complicado no início se esta for sua primeira vez. Os Sitemaps são feitos para robôs de rastreamento de mecanismos de pesquisa, não para humanos. Como afirmamos, existem muitas ferramentas no SEO moderno que criam mapas de site perfeitos.

É vital entender a estrutura do XML para garantir que as ferramentas estejam fazendo seu trabalho.

Vamos detalhar um mapa do site simples:

  • Declaração XML : esta declaração informa ao bot do mecanismo de pesquisa o que ele está lendo; na maioria dos casos, é um tipo de arquivo XML. Outras declarações dizem ao bot; informações de versão e tipo de codificação. O mapa do site deve ser UTF-8.
  • Conjunto de URL : esta seção contém os URLs no mapa do site. Conjunto de URL informa aos bots sobre qual padrão é usado. O padrão mais comum é 0,90, que é suportado pelo Google, Microsoft e Yahoo.
  • URL : os webmasters devem informar ao bot de cada URL aninhada na tag <loc>. É crucial afirmar; os URLs devem ser URLs canônicos absolutos, não relativos. A tag <loc> é o único elemento obrigatório neste estágio.

Depois que o webmaster declarar o URL, ele poderá usar qualquer uma das tags opcionais acima para entender melhor cada entrada. Inclua apenas páginas relevantes de SEO; você ajuda o bot de rastreamento a trabalhar de forma mais inteligente, o que, por sua vez, ajuda seu senhor a colher os benefícios de uma boa sessão de rastreamento.

Um bot de rastreamento chega a um site com parâmetros predeterminados para rastrear um site de exemplo de mapa de site xml. Esses parâmetros geralmente são baseados nos últimos resultados. Não desperdice o tempo valioso do bot de rastreamento incluindo páginas de sites menos relevantes, apenas as melhores.

Teste o SEO e o desempenho do seu site em 60 segundos!

Um bom design do site é fundamental para o engajamento e as conversões do visitante, mas um site lento ou erros de desempenho podem fazer com que até mesmo o site mais bem projetado tenha um desempenho inferior. Diib é uma das melhores ferramentas de monitoramento de desempenho de sites e SEO do mundo. A Diib usa o poder do big data para ajudá-lo a aumentar de forma rápida e fácil seu tráfego e classificações. Como visto em Empreendedor!

  • Ferramenta de SEO automatizada fácil de usar
  • Monitoramento de palavras-chave e backlinks + ideias
  • Garante velocidade, segurança, + rastreamento de Core Vitals
  • Sugere de forma inteligente ideias para melhorar o SEO
  • Mais de 250.000 mil membros globais
  • Benchmarking integrado e análise de concorrentes

Por exemplo “www.diib.com”

Usado por mais de 250 mil empresas e organizações:

  • logotipo
  • logotipo
  • logotipo
  • logotipo

Sincroniza com Google Analytics

Criação de links

Páginas que NÃO devem ser incluídas no seu mapa do site:

  • Utilitário e páginas arquivadas
  • Páginas bloqueadas pelo arquivo robots.txt e páginas noindex
  • Páginas e posts duplicados e paginados
  • Páginas não canônicas
  • Respostas a comentários e URLs de e-mail
  • Redirecionamento, páginas ausentes e páginas de erro

Tenha cuidado com um gerador de sitemap html. Alguns não são confiáveis ​​e praticam SEO ruim, incluindo URLs não canônicos e páginas noindex.

Ter páginas de baixa qualidade em um sitemap tem consequências terríveis para SEO:

  • O primeiro e mais importante; eles desperdiçam tempo valioso do orçamento de rastreamento. Esse tempo pode ser melhor aproveitado explorando totalmente apenas as melhores páginas e links do seu site.
  • As páginas de baixa qualidade roubam a autoridade do link de páginas que podem ter uma classificação mais alta. Por exemplo, o blog aHrefs excluiu um terço de suas postagens insignificantes e descobriu que o tráfego aumentou.
  • Os usuários encontram uma experiência de nível inferior se direcionados para páginas não essenciais. Os visitantes ficam irritados quando chegam a páginas inúteis de um site e se afastam rapidamente. Mantenha apenas as melhores páginas de um site.

Diferentes tipos de Sitemaps

Existem agora mais de 140 motores de busca e diretórios em todo o mundo. Na última contagem, o Google indexou quase 4,5 bilhões de páginas da web. À medida que a internet cresce, cresce também o número de tipos de sitemap, gerador de sitemap html. A questão se torna o que é sitemap.xml em seo?

À medida que a complexidade e o tamanho dos sites continuam a crescer, o mesmo acontece com as tecnologias de sitemap.

Mapa do site XML

XML Sitemap é o arquivo padrão para que seu site seja notado na internet. No entanto, existem algumas limitações para o mapa do site XML. Não mais de 50.000 URLs podem ser processados ​​e há um limite de tamanho de 50 mb.

Se o seu sitemap exceder um dos dois limites, eles precisarão ser divididos em outro arquivo de sitemap. Sites grandes podem adotar uma abordagem granular criando vários arquivos de índice, se necessário.

Do Blog do webmaster do Google, exemplo de mapa do site xml de vários arquivos de índice:

  1. xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml

A criação de arquivos de índice separados é ideal para um arranjo de vários sites. Ou lojas que desejam enviar conteúdo em diferentes horários do dia. Webmasters questionam o que é sitemap.xml em seo. A imagem abaixo mostra outro exemplo de Sitemap XML:

O que é um Sitemap XML

(Crédito da imagem: Search Engine Journal)

Mapa do site de imagem XML

O XML Image Sitemap é um excelente recurso para sites com muitos vídeos ou imagens junto com conteúdo.

Sitemaps de imagem podem ser desnecessários devido às práticas modernas de SEO. A maioria dos sites tem imagens incorporadas em suas páginas. Os mecanismos de pesquisa rastreiam imagens junto com qualquer conteúdo da página. Aqui está um exemplo de um Sitemap de imagem XML:

O que é um Sitemap XML

(Crédito da imagem: SwissUpLabs)

Use a marcação; JSON-LD schema.org/ImageObject, dando ao webmaster mais opções de personalização.

Os sitemaps de imagem ocupam muitos orçamentos de rastreamento para a maioria dos sites. Se você tem um site onde as imagens são parte fundamental do site, dê uma olhada nas opções. Sites de comércio eletrônico e jogos podem se beneficiar de um arquivo de imagem de mapa do site.

Arquivos XML de vídeo

Os arquivos XML de vídeo são semelhantes ao mapa do site da imagem. Se os vídeos forem essenciais para o sucesso do seu site, envie um arquivo XML de vídeo para rastreamento. Por exemplo:

O que é um Sitemap XML

(Crédito da imagem: Moz)

Novamente, não desperdice o valioso tempo que os sites têm quando um bot vem rastreando.

XML dinâmico

O XML dinâmico atualiza automaticamente os mapas do site que, de outra forma, seriam conteúdo desatualizado. Sitemaps estáticos tornam-se obsoletos assim que o conteúdo é alterado ou revisado de alguma forma. Sitemaps estáticos não aproveitam a tag lastmod.

As práticas recomendadas modernas de SEO criaram Sitemaps dinâmicos para conteúdo em constante mudança. O servidor de um webmaster envia automaticamente um novo mapa do site sempre que são feitas alterações.

Qualquer uma dessas etapas pode ajudar o webmaster a criar um arquivo de mapa de site dinâmico:

  • Tenha seu código de desenvolvedor um script personalizado; apontando a tarefa envolvida
  • Use uma ferramenta geradora de sitemap
  • A maioria das plataformas CMS oferece plugins para gerar um arquivo XML de sitemap dinâmico.

Sitemaps HTML

Os Sitemaps HTML são arquivos de indexação antigos e só devem ser usados ​​se outros arquivos XML não se adequarem ao aplicativo. Os sitemaps HTML foram projetados para ajudar os usuários humanos a encontrar conteúdo.

Sitemaps HTML atestam a qualidade do link de um site. O sitemap HTML deve ser considerado cuidadosamente por qualquer motivo para existir. Se os webmasters projetaram seus sites com uma política de links firme e um mapa do site XML; pergunte a si mesmo; é necessário um mapa do site HTML?

Na maioria dos casos; Não.

Esperamos que você tenha achado este artigo útil.

Se você quiser saber mais sobre a saúde do seu site, obter recomendações e alertas pessoais, escaneie seu site pela Diib. Leva apenas 60 segundos.

Digite seu site

Por exemplo “www.diib.com”

Eu não me canso de DIIB!! Melhor ferramenta e estou muito grato por encontrá-lo. Eu absolutamente amo!! Dedos cruzados, você não aumenta seus preços porque isso é tão perfeito.
Depoimentos
Katarina Gage
Diretor de Operações em ahoymatey.com.au

Sitemaps do Google Notícias

Os Sitemaps do Google Notícias são restritos a sites registrados no mecanismo de pesquisa. Restrições são artigos de notícias publicados nos últimos dois dias até um máximo de 1.000 URLs.

Os Sitemaps do Google Notícias não são compatíveis com sitemaps de imagem ou vídeo.

O mecanismo de pesquisa recomenda o uso do schema.org para especificar os atributos de uma imagem em miniatura. Por exemplo:

O que é um Sitemap XML

(Crédito da imagem: G-Squared Interactive)

Sitemaps para celular

Os sitemaps para celular são códigos herdados e estão disponíveis para webmasters, mas geralmente nunca são necessários. Arquivos XML móveis são para páginas de feature phone, não smartphones. Esses sitemaps não beneficiam os webmasters, a menos que o site tenha URLs específicos para esse tipo de plataforma.

Otimizando SEO com Sitemaps

Agora que o básico foi abordado, é hora de ver como os sitemaps são inestimáveis ​​para os sites. Os webmasters não devem incluir todas as páginas de seu site em um mapa do site, apenas as páginas relevantes e com autoridade de SEO.

Cinco razões de SEO para criar um Sitemap

  • Os Sitemaps são gratuitos e muito fáceis de criar. Como dito anteriormente, toda plataforma CMS possui vários plug-ins e scripts de mapa do site. O WordPress sozinho possui dezenas de aplicativos diferentes, desde um único mapa do site até serviços abrangentes de SEO.

Sitemaps são ferramentas de SEO inestimáveis. Eles incentivam todos os mecanismos de pesquisa a indexar mais conteúdo do seu site e indexá-lo corretamente.

É aconselhável ter um mapa do site criado como parte de uma estratégia geral de SEO eficaz. Recursos do WordPress; Plugins Yoast SEO e All in One que oferecem funcionalidades úteis.

  • Classificação melhorada. Imagens e vídeos podem melhorar a classificação de pesquisa do seu site fornecendo informações adicionais aos bots de rastreamento.

Usar um sitemap para vídeos hospedados em seu site significa que os webmasters podem incluir metadados adicionais para cada vídeo. As informações podem incluir locais, título, descrição, duração, contagem de visualizações e categorias. Os mesmos dados podem ser incluídos para cada imagem incorporada em seu site.

  • Prioridade de rastreamento. As páginas de alto valor recebem prioridade de rastreamento com um sitemap. Se não houver um roteiro para um site, os bots de rastreamento não terão direção quando chegarem ao seu site.

Controlar o processo de rastreamento deve ser uma prioridade para os webmasters. Os webmasters podem criar prioridades para cada uma de suas páginas. Por exemplo, uma página inicial pode ter 100% de prioridade, enquanto documentos de baixo nível podem ter 60% de prioridade. Essa flexibilidade é benéfica para definir o valor do seu site, página por página.

  • Descubra mais páginas. Sitemaps válidos ajudam os bots de rastreamento a descobrir mais páginas, o que significa que mais conteúdo é indexado.

Os Sitemaps não garantem resultados de pesquisa mais altos, apenas que mais conteúdo do site é descoberto.

Outro recurso essencial, os sitemaps protegem contra conteúdo duplicado. É frustrante publicar um conteúdo original mais tarde para encontrar o mesmo conteúdo no site de um concorrente.

Se dois conteúdos idênticos forem encontrados, os mecanismos tentam manter o original e descartar o duplicado. Os mecanismos de pesquisa rastrearão um site com mais frequência se um sitemap válido for usado. Eles nem sempre recebem a chamada certa no original, mas você tem a proteção.

  • Links. Os mecanismos de pesquisa, principalmente o Google, podem adicionar links de site adicionais a um site se incluir um mapa do site. O algoritmo do Google pode adicionar links valiosos na listagem orgânica do site, dando aos usuários uma visão mais completa da consulta. Este processo é automatizado; no entanto, as chances são melhores se um site tiver um mapa do site.
  • Os erros são minimizados. Erros de rastreamento são destacados; se você fornecer ao Google a localização de um sitemap válido, o mecanismo de pesquisa retribuirá o favor fornecendo aos webmasters informações sobre o rastreamento. Use o Google Search Console e o Bing Webmaster para enviar qualquer sitemap.

Os bots rastreiam o site e relatam suas descobertas. Este recurso é inestimável para as melhores práticas de SEO.

Diib: obtenha as métricas mais recentes em seu sitemap XML

O SEO começa no nível granular de um site no diretório raiz. Os webmasters devem entender a hierarquia de cada site e página e construí-los com os motores de busca em mente. A Diib Digital oferece as métricas mais abrangentes e atualizadas sobre a integridade do seu sitemap XML e o alertará sobre possíveis problemas muito antes que eles afetem gravemente sua classificação ou tráfego. Aqui estão alguns dos recursos do nosso Painel do usuário que você vai adorar:

  • Rastreamento e integridade do sitemap
  • Monitoramento de domínio 24 horas por dia, 7 dias por semana
  • Reparo da taxa de rejeição
  • Pós desempenho
  • Páginas quebradas onde você tem backlinks (verificador 404)
  • Ferramentas de monitoramento e rastreamento de palavras-chave, backlinks e indexação
  • Experiência do usuário e otimização de velocidade móvel

Obtenha uma verificação gratuita do site em 60 segundos ou simplesmente ligue para 800-303-3510 para falar com um de nossos especialistas em crescimento.