¿Qué es un mapa del sitio XML y cómo crear uno?
Publicado: 2020-11-20Crear un sitio web requiere mucha disciplina y curiosidad para que se note en un panorama de Internet en constante expansión: uno de los pasos fundamentales para el éxito de SEO es un mapa del sitio.
Un protocolo de mapa del sitio es una hoja de ruta para su sitio web. Los mapas de sitio útiles permiten que los motores de búsqueda rastreen su sitio de manera más eficiente. Google introdujo el protocolo por primera vez en 2005, permitiendo a los desarrolladores publicar enlaces desde sus sitios.
El soporte conjunto de Yahoo y Microsoft llegó en 2006, y más tarde ese mismo año, Ask.com e IBM dieron su respaldo al nuevo protocolo. Uno de los avances significativos del protocolo fue el descubrimiento automático a través del archivo robots.txt.
¿Qué es un mapa del sitio?
La función de un motor de búsqueda es buscar en Internet nuevos códigos y páginas web. Una segunda función es indexar el contenido y colocarlo en una jerarquía detectable: la pieza final del rompecabezas; Mostrar contenido a consultas relevantes.
Los sitemaps son la interfaz entre un sitio web y los motores de búsqueda. Un mapa del sitio de Google es una extensión de archivo XML que brinda a los webmasters la capacidad de informar a los robots rastreadores sobre las URL nuevas y modificadas. Los mapas de sitio útiles le dicen a los bots cuándo se actualizó la URL por última vez y su importancia para otras URL en el sitio. Así es como puede verse un mapa del sitio:
(Crédito de la imagen: mapeador DYNO)
Los humanos usan mapas de sitios como un marcador SEO para sus sitios web. Sin embargo, debe entenderse completamente: un índice de mapa de sitio es para los robots de rastreo del motor de búsqueda. Cualquier cosa que los webmasters puedan hacer para aumentar esta comunicación, mejor.
Los motores de búsqueda envían robots rastreadores o arañas periódicamente para encontrar contenido actualizado. Los bots son pequeños fragmentos de código que interactúan con el motor y su sitio web. Cuanto más eficiente sea su mapa del sitio, más fácil será para un motor de búsqueda descubrir e indexar nuevos contenidos y enlaces.
El rastreo es el proceso mediante el cual los bots visitan sitios web según el algoritmo de frecuencia de un motor de búsqueda y otros factores. Los rastreadores usan enlaces para descubrir otras páginas prestando mucha atención al contenido nuevo y los cambios en el tema existente.
Google y otros motores han brindado a los webmasters una opción granular cuando el robot de búsqueda rastrea sus sitios. Esta característica es un avance significativo a las políticas arcanas del pasado.
Si está configurando su mapa del sitio de Google, hay un par de condiciones que deben seguirse:
- La ubicación de su mapa del sitio debe estar en el directorio raíz de su sitio web. Los bots de rastreo generalmente comienzan en la raíz y se mueven hacia afuera. Si hay un mapa del sitio, lo ha hecho más fácil para el bot.
- En segundo lugar, cada URL posterior debe ser igual que el mapa del sitio. Si el mapa del sitio tiene el protocolo HTTP:, cada URL debe tener la misma extensión HTTP:.
- Los principales motores de búsqueda ahora permiten varios archivos de mapa del sitio en un solo directorio para facilitar el rastreo. La cantidad máxima de URL permitidas en un solo archivo de mapa de sitio es 50,000. Los webmasters pueden desglosar ese número aún más y tener múltiples mapas de sitio para definir mejor la estructura del sitio web.
- Siga los formatos del mapa del sitio de Sitemaps.org para establecer el esquema correcto para su sitio.
SEO y su mapa del sitio
Cada sitio web necesita un mapa del sitio y el conocimiento de cómo crear mapas del sitio xml, ya sea nuevo con una sola página o una tienda de comercio electrónico con miles de productos. Los sitios web se benefician cuando los motores de búsqueda pueden encontrar fácilmente páginas importantes y cuándo se actualizaron por última vez.
Un mapa del sitio en la estructura de su sitio web le dice a los motores de búsqueda que cada URL incluida es una página de destino de calidad.
Las mejores prácticas de SEO siempre están cambiando; lo que fue un excelente consejo ayer sobre cómo crear un mapa del sitio xml puede haber cambiado hoy. Es aconsejable conocer la ubicación de las mejores prácticas de SEO para cada uno de los motores de búsqueda a los que se dirige su sitio web.
Manténgase alejado de opiniones amplificadas en blogs y foros. Concéntrese en lo que es esencial, como los requisitos de un mapa del sitio xml de Google. Tómese el tiempo para difundir el ruido y formar sus mejores prácticas a partir de los principales motores.
usted estará interesado
Cómo escalar con éxito su negocio
Velocidad de carga del sitio web: herramientas para la optimización
Comprobación del estado del sitio web: herramientas y consejos
¿Qué significa UX?
Formato de un Sitemap XML
- org es la fuente definitiva de lo que es el protocolo xml del mapa del sitio y cómo estructurar un mapa del sitio. El formato adecuado de un mapa del sitio XML consiste en una serie de etiquetas descriptivas. Cada valor debe tener escape de entidad, lo que significa que el mapa del sitio está codificado en UTF-8. Por ejemplo:
(Crédito de la imagen: mapas del sitio)
UTF-8 es la abreviatura de Unicode Transformation Format-8 Bit. Esta designación representa un carácter estándar de comunicación electrónica de anchura variable. Otra condición de formato: cada URL del mapa del sitio debe codificarse para que el servidor web pueda leerlo.
Las siguientes son definiciones de etiquetas de mapas de sitios; algunos son algunos de los requisitos del mapa del sitio xml de Google, mientras que otros son opcionales.
- <urlset> es una etiqueta obligatoria. Este estándar hace referencia a; qué es el protocolo xml del mapa del sitio y describe el archivo.
- <url> es la etiqueta principal de cada entrada. Cada etiqueta después de esta entrada es una etiqueta secundaria.
- <loc> es otra etiqueta obligatoria. Esta característica hace referencia a la URL y comienza con un protocolo como HTTP o HTTPS, y debe terminar con una barra inclinada si el servidor web lo requiere. Este valor debe tener menos de 2048 caracteres.
- <lastmod> es una etiqueta opcional que define cuándo se modificó por última vez el archivo. La etiqueta debe tener un formato de fecha y hora W3C. La etiqueta es independiente de la etiqueta if-modified-since. Los motores de búsqueda pueden utilizar información de fuentes alternativas.
- <changefreq> es otra etiqueta opcional que mejora la capacidad de búsqueda del mapa del sitio. Esta etiqueta muestra la frecuencia con la que es probable que cambie la página.
Siempre, utilizado para describir documentos que cambiarán cada vez que se acceda a ellos:
- Cada hora
- Diario
- Semanalmente
- Mensual
- Anual
- Nunca, URL archivadas
Los rastreadores web pueden acceder a una página más a menudo que cada hora y pueden rastrear páginas marcadas anualmente con más frecuencia. Las páginas marcadas con nunca se pueden rastrear para manejar cambios inesperados.
- <prioridad> es una etiqueta de URL relativa a otras URL en el sitio. Los valores van de 0,0 a 1,0, siendo el valor predeterminado 0,5. El valor no afecta cómo se comparan las páginas con otros sitios. La etiqueta muestra los requisitos del mapa del sitio xml de Google y las páginas que el webmaster considera más importantes para los rastreadores.
No es probable que las prioridades asignadas influyan en la posición de búsqueda. Los webmasters pueden usar esta etiqueta para aumentar la probabilidad de que se indexen las páginas más importantes.
Crear un mapa del sitio
Crear un índice de mapa del sitio puede parecer abrumador al principio si es la primera vez. Los sitemaps están hechos para robots de rastreo de motores de búsqueda, no para humanos. Como hemos dicho, hay muchas herramientas en el SEO moderno que crean mapas de sitio perfectos.
Es vital entender la estructura de XML para asegurarse de que las herramientas estén haciendo su trabajo.
Analicemos un mapa del sitio simple:
- Declaración XML : esta declaración le dice al bot del motor de búsqueda lo que está leyendo; en la mayoría de los casos, es un tipo de archivo XML. Otras declaraciones le dicen al bot; información de versión y tipo de codificación. El mapa del sitio debe ser UTF-8.
- Conjunto de URL : esta sección contiene las URL en el mapa del sitio. El conjunto de URL informa a los bots sobre qué estándar se utiliza. El estándar más común es 0.90, que es compatible con Google, Microsoft y Yahoo.
- URL : los webmasters deben informar al bot de cada URL anidada en la etiqueta <loc>. Es crucial declarar; las URL deben ser URL canónicas absolutas, no relativas. La etiqueta <loc> es el único elemento requerido en esta etapa.
Después de que el webmaster declara la URL, puede usar cualquiera de las etiquetas opcionales de arriba para comprender mejor cada entrada. Incluya solo páginas SEO relevantes; ayudas al robot de rastreo a trabajar de manera más inteligente, lo que a su vez ayuda a tu padre a obtener los beneficios de una buena sesión de rastreo.
Un bot de rastreo llega a un sitio web con parámetros predeterminados para rastrear un sitio de ejemplo de mapa de sitio xml. Estos parámetros generalmente se basan en los últimos resultados. No pierda el valioso tiempo del bot de rastreo al incluir páginas de sitios web menos relevantes, solo las mejores.
¡Prueba el SEO y el rendimiento de tu sitio en 60 segundos!
Un buen diseño del sitio web es fundamental para la participación de los visitantes y las conversiones, pero un sitio web lento o errores de rendimiento pueden hacer que incluso el sitio web mejor diseñado tenga un rendimiento inferior. Diib es una de las mejores herramientas de monitoreo de SEO y rendimiento de sitios web del mundo. Diib utiliza el poder de los grandes datos para ayudarlo a aumentar rápida y fácilmente su tráfico y clasificaciones. Como se ve en Emprendedor!
- Herramienta SEO automatizada fácil de usar
- Monitoreo de palabras clave y backlinks + ideas
- Garantiza la velocidad, la seguridad y el seguimiento de Core Vitals
- Sugiere inteligentemente ideas para mejorar el SEO
- Más de 250,000k miembros globales
- Comparación integrada y análisis de la competencia
Utilizado por más de 250 000 empresas y organizaciones:
sincroniza con 
Páginas que NO debe incluir en su mapa del sitio:
- Utilidad y páginas archivadas
- Páginas bloqueadas por el archivo robots.txt y páginas sin índice
- Páginas y publicaciones duplicadas y paginadas
- Páginas no canónicas
- Respuestas a comentarios y direcciones URL de correo electrónico
- Redirección, páginas faltantes y páginas de error
Tenga cuidado con un generador de mapas de sitios html. Algunos no son confiables y practican un mal SEO al incluir URL no canónicas y páginas sin índice.

Tener páginas de baja calidad en un mapa del sitio tiene graves consecuencias para el SEO:
- El primero y más importante; desperdician tiempo valioso del presupuesto de rastreo. Este tiempo podría aprovecharse mejor explorando completamente solo las mejores páginas y enlaces de su sitio.
- Las páginas de baja calidad roban la autoridad de enlace de las páginas que pueden clasificarse más alto. Por ejemplo, el blog de aHrefs eliminó un tercio de sus publicaciones insignificantes y descubrió que el tráfico aumentó.
- Los usuarios encuentran una experiencia de nivel inferior si se les dirige a páginas no esenciales. Los visitantes se molestan cuando aterrizan en páginas sin valor de un sitio web y se alejarán rápidamente. Mantenga solo las mejores páginas en un sitio web.
Diferentes tipos de mapas de sitio
Ahora hay más de 140 motores de búsqueda y directorios en todo el mundo. Según el último recuento, Google ha indexado casi 4500 millones de páginas web. A medida que Internet crece, también lo hace la cantidad de tipos de mapas de sitios, generador de mapas de sitios html. ¿La pregunta se convierte en qué es sitemap.xml en seo?
A medida que la complejidad y el tamaño de los sitios web sigan creciendo, también lo harán las tecnologías de mapas de sitios.
Mapa del sitio XML
XML Sitemap es el archivo estándar para que su sitio se destaque en Internet. Sin embargo, existen algunas limitaciones en el mapa del sitio XML. No se pueden procesar más de 50.000 URL y hay un límite de tamaño de 50 mb.
Si su mapa del sitio excede cualquiera de los dos límites, deberán dividirse en otro archivo de mapa del sitio. Los sitios grandes pueden adoptar un enfoque granular mediante la creación de múltiples archivos de índice si es necesario.
Del blog para webmasters de Google, ejemplo de mapa de sitio xml de varios archivos de índice:
- xml http://example.com/stores/store2_sitemapindex.xml http://example.com/stores/store3_sitemapindex.xml
La creación de archivos de índice separados es ideal para un arreglo de múltiples sitios. O tiendas que quieran enviar contenido en diferentes momentos del día. Los webmasters se preguntan qué es sitemap.xml en SEO. La siguiente imagen muestra otro ejemplo de Sitemap XML:
(Crédito de la imagen: Diario del motor de búsqueda)
Mapa del sitio de imagen XML
XML Image Sitemap es un excelente recurso para sitios con muchos videos o imágenes junto con contenido.
Los sitemaps de imágenes pueden ser innecesarios debido a las prácticas modernas de SEO. La mayoría de los sitios web tienen imágenes incrustadas en sus páginas. Los motores de búsqueda rastrean imágenes junto con cualquier contenido de la página. Este es un ejemplo de un Sitemap de imagen XML:
(Crédito de la imagen: SwissUpLabs)
Utilice el marcado; JSON-LD schema.org/ImageObject, lo que brinda al webmaster más opciones de personalización.
Los sitemaps de imágenes ocupan demasiados presupuestos de rastreo para la mayoría de los sitios web. Si tienes un sitio web donde las imágenes son parte fundamental del sitio, fíjate bien en las opciones. Los sitios de comercio electrónico y juegos pueden beneficiarse de un archivo de imagen de mapa del sitio.
Archivos XML de vídeo
Los archivos XML de video son similares al mapa del sitio de imágenes. Si los videos son críticos para el éxito de su sitio web, envíe un archivo XML de video para rastrear. Por ejemplo:
(Crédito de la imagen: Moz)
Nuevamente, no pierda el valioso tiempo que tienen los sitios cuando un bot se arrastra.
XML dinámico
El XML dinámico actualiza automáticamente los mapas del sitio que, de lo contrario, serían contenido desactualizado. Los sitemaps estáticos se vuelven obsoletos tan pronto como el contenido se modifica o revisa de alguna manera. Los sitemaps estáticos no aprovechan la etiqueta lastmod.
Las mejores prácticas modernas de SEO han diseñado mapas de sitio dinámicos para contenido en constante cambio. El servidor de un webmaster envía automáticamente un nuevo mapa del sitio cada vez que se realizan cambios.
Cualquiera de estos pasos puede ayudar al webmaster a crear un archivo de mapa de sitio dinámico:
- Haga que su desarrollador codifique un script personalizado; señalando la tarea involucrada
- Utilice una herramienta generadora de mapas de sitio
- La mayoría de las plataformas CMS ofrecen complementos para generar un archivo XML de mapa de sitio dinámico.
Mapas del sitio HTML
Los Sitemaps HTML son archivos de indexación de la vieja escuela y solo deben usarse si otros archivos XML no se ajustan a la aplicación. Los mapas de sitio HTML se diseñaron para ayudar a los usuarios humanos a encontrar contenido.
Los mapas de sitio HTML dan fe de la calidad de los enlaces de un sitio. El mapa del sitio HTML debe considerarse cuidadosamente por cualquier razón que exista. Si los webmasters han diseñado sus sitios con una política de enlaces firme y un mapa del sitio XML; pregúntese; ¿Se necesita un mapa del sitio HTML?
En la mayoria de los casos; No.
Esperamos que este artículo le haya resultado útil.
Si desea obtener más información interesante sobre el estado de su sitio, obtener recomendaciones y alertas personales, escanee su sitio web por Diib. Solo toma 60 segundos.
Sitemaps de noticias de Google
Los Sitemaps de Google News están restringidos a los sitios registrados en el motor de búsqueda. Las restricciones son artículos de noticias publicados en los últimos dos días hasta un máximo de 1000 URL.
Los Sitemaps de Google Noticias no admiten sitemaps de imágenes o vídeos.
El motor de búsqueda recomienda usar schema.org para especificar los atributos de una imagen en miniatura. Por ejemplo:
(Crédito de la imagen: G-Squared Interactive)
Mapas de sitios móviles
Los sitemaps móviles son código heredado y están disponibles para los webmasters, pero por lo general nunca se necesitan. Los archivos XML móviles son para páginas de teléfonos con funciones, no para teléfonos inteligentes. Estos sitemaps no benefician a los webmasters a menos que el sitio web tenga URL específicas para este tipo de plataforma.
Optimización de SEO con Sitemaps
Ahora que se han cubierto los conceptos básicos, es hora de ver cómo los mapas de sitio son invaluables para los sitios web. Los webmasters no deben incluir todas las páginas de su sitio web en un mapa del sitio, solo las páginas relevantes y con autoridad SEO.
Cinco razones SEO para crear un mapa del sitio
- Los sitemaps son gratuitos y muy fáciles de crear. Como se indicó anteriormente, cada plataforma CMS tiene varios complementos y scripts de mapas de sitios. Solo WordPress tiene docenas de aplicaciones diferentes, desde un solo mapa del sitio hasta servicios integrales de SEO.
Los sitemaps son herramientas de SEO invaluables. Animan a todos los motores de búsqueda a indexar más contenido de su sitio web e indexarlo correctamente.
Es recomendable tener un mapa del sitio creado como parte de una estrategia de SEO efectiva en general. características de WordPress; Complementos Yoast SEO y All in One que ofrecen una funcionalidad útil.
- Clasificación mejorada. Las imágenes y los videos pueden mejorar la clasificación de búsqueda de su sitio al proporcionar información adicional a los robots de rastreo.
El uso de un mapa del sitio para videos alojados en su sitio significa que los webmasters pueden incluir metadatos adicionales para cada video. La información puede incluir ubicaciones, título, descripción, duración, recuento de vistas y categorías. Se pueden incluir los mismos datos para cada imagen incrustada en su sitio.
- Prioridad de rastreo. Las páginas de alto valor tienen prioridad de rastreo con un mapa del sitio. Si no hay una hoja de ruta para un sitio web, los robots de rastreo no tienen dirección una vez que llegan a su sitio.
Controlar el proceso de rastreo debería ser una prioridad para los webmasters. Los webmasters pueden crear prioridades para cada una de sus páginas. Por ejemplo, una página de inicio puede tener una prioridad del 100 %, mientras que los documentos de bajo nivel pueden tener una prioridad del 60 %. Esta flexibilidad es beneficiosa para definir el valor de su sitio, página por página.
- Descubre más páginas. Los sitemaps válidos ayudan a los robots de rastreo a descubrir más páginas, lo que significa que se indexa más contenido.
Los sitemaps no garantizan mejores resultados de búsqueda, solo que se descubra más contenido del sitio web.
Otra característica esencial, los mapas de sitio protegen contra el contenido duplicado. Es frustrante publicar un contenido original y luego encontrar el mismo contenido en el sitio web de un competidor.
Si se encuentran dos piezas idénticas de contenido, los motores intentan conservar el original y descartar el duplicado. Los motores de búsqueda rastrearán un sitio con mayor frecuencia si se utiliza un mapa del sitio válido. No siempre reciben la llamada correcta en el original, pero usted tiene la protección.
- Enlaces. Los motores de búsqueda, principalmente Google, pueden agregar enlaces de sitio adicionales a un sitio web si incluye un mapa del sitio. El algoritmo de Google puede agregar vínculos valiosos en la lista orgánica del sitio, brindando a los usuarios una imagen más completa de la consulta. Este proceso está automatizado; sin embargo, las posibilidades son mejores si un sitio web tiene un mapa del sitio.
- Los errores se minimizan. Los errores de rastreo están resaltados; si le proporciona a Google la ubicación de un mapa del sitio válido, el motor de búsqueda le devuelve el favor al proporcionar a los webmasters información sobre el rastreo. Use Google Search Console y Bing Webmaster para enviar cualquier mapa del sitio.
Los bots rastrean el sitio e informan sus hallazgos. Este recurso es invaluable para las mejores prácticas de SEO.
Diib: obtenga las métricas más recientes en su mapa del sitio XML
El SEO comienza en el nivel granular de un sitio web en el directorio raíz. Los webmasters deben comprender la jerarquía de cada sitio y página y crearlos teniendo en cuenta los motores de búsqueda. Diib Digital ofrece las métricas más completas y actualizadas sobre el estado de su mapa de sitio XML y lo alertará sobre posibles problemas mucho antes de que afecten gravemente su clasificación o tráfico. Estas son algunas de las características de nuestro panel de usuario que le encantarán:
- Seguimiento y estado del mapa del sitio
- Monitoreo de dominio 24/7
- Reparación de la tasa de rebote
- Post rendimiento
- Páginas rotas donde tienes backlinks (verificador 404)
- Herramientas de monitoreo y seguimiento de palabras clave, backlinks e indexación
- Experiencia de usuario y optimización de la velocidad móvil
Obtenga un escaneo gratuito de 60 segundos del sitio o simplemente llame al 800-303-3510 para hablar con uno de nuestros expertos en crecimiento.