¿Indización semántica latente para SEO? Su optimización de contenido merece algo mejor

Publicado: 2019-04-17

¿Recuerdas esa escena en The Matrix donde Morpheus (Laurence Fishburne) sostiene una cápsula en cada una de sus palmas, describiendo la elección que enfrenta Neo (Keanu Reeves)?

Él dice: “Esta es tu última oportunidad. Después de esto, no hay vuelta atrás. Tomas la píldora azul: la historia termina, te despiertas en tu cama y crees lo que quieras creer. Tomas la pastilla roja, te quedas en el País de las Maravillas y te muestro cuán profundo llega el agujero del conejo. Recuerde: todo lo que estoy ofreciendo es la verdad. Nada mas."

Esta publicación de blog es algo así. En este caso, vamos a hablar de la indexación semántica latente, en concreto:

  • Lo que es
  • Por qué es tan popular entre la multitud de SEO
  • Si Google lo usa
  • Si ayuda a sus esfuerzos de SEO

Al final, al igual que Neo, puedes elegir creer lo que quieras. Entonces empecemos. (cola de tema musical de suspenso)

¿Qué es la indexación semántica latente (LSI)?

En el mundo del SEO, la indexación semántica latente (LSI) y el análisis semántico latente (LSA) son términos intercambiables. No vamos a dividirnos en detalles sobre su diferencia, por lo que seguiremos la misma práctica en esta publicación de blog.

LSI es una técnica que analiza las relaciones entre un conjunto de documentos y los términos contenidos en ellos. Existe una suposición subyacente de que las palabras cercanas en significado aparecerán en textos similares (conocida como la hipótesis distributiva). Se basa en una técnica matemática llamada descomposición de valores singulares para identificar esas relaciones.

Para aquellos interesados, aquí hay un excelente ejemplo de indexación semántica latente (pdf) al que pueden referirse.

No te preocupes si las matemáticas no son lo tuyo. No necesita apreciar los matices técnicos del proceso.

Lo que es importante entender es que LSI se creó para indexar el contenido de las colecciones de documentos con actualizaciones poco frecuentes.

¿Por que importa? Llegaremos a eso más tarde.

Primero, tratemos de entender cómo LSI se convirtió en algo tan importante en el mundo del SEO.

Palabras clave de LSI y su popularidad entre los expertos en SEO

Parece que el mundo de la optimización de motores de búsqueda pasa por fases en las que una estrategia en particular se vuelve popular. En un momento fue el relleno de palabras clave, una práctica en la que ciertas frases se repetían hasta la saciedad dentro de una publicación de blog. Es cierto que no hizo nada para mejorar el contenido. Pero funcionó hasta que los motores de búsqueda se dieron cuenta de la táctica.

El siguiente "avance" del SEO en la página se centró en la densidad de palabras clave. En lugar de ser indiscriminados con el relleno de palabras clave, todos los expertos en SEO hicieron proselitismo de su opinión sobre cuántas frases de palabras clave se podían incluir en un artículo sin que los descubrieran.

En retrospectiva, no puedes evitar reírte de la inutilidad de todo esto. Pero era un asunto serio en ese entonces. ¡Sorprendentemente, esta estrategia de SEO absolutamente inútil continúa atrayendo interés!

Aquí hay otra de esas técnicas de SEO sobre las que quiero advertirte.

Hay expertos en SEO que afirman que Google utiliza algún tipo de tecnología LSI. Si bien no estoy seguro de quién inició este equivalente SEO de una leyenda urbana, una cosa es segura. Mucha gente habla de ello como si fuera un hecho.

163.000 resultados para el término de búsqueda “indexación semántica latente y SEO”

Supongo que eso no es sorprendente. Cuando algunos influyentes conocidos de la industria de SEO se apoderan del término y comienzan a afirmar cómo la optimización de LSI ayuda a impulsar el tráfico orgánico, la manada seguramente los seguirá.

En la superficie, la idea de que LSI conduce al éxito de SEO parece plausible. Sabemos que Google está interesado en la semántica: comprender el lenguaje natural y comprender el significado oculto detrás de las palabras en una página. Aquí, dicen tanto.

Además, si usted es una empresa de SEO que intenta vender servicios de SEO comunes y corrientes a un precio superior, el uso de términos y frases como indexación semántica latente lo hace sonar muy inteligente (y costoso).

Además, ¿cuántos algoritmos de modelado de temas comprenderá el equipo de marketing digital promedio? Probablemente en algún lugar entre cero y uno.

Además, la indexación semántica latente suena mucho más atractiva que la frecuencia de término-frecuencia de documento inversa (TF-IDF) o la asignación de Dirichlet latente (LDA).

Aún así la pregunta permanece.

¿Los motores de búsqueda utilizan la indexación semántica latente?

Aunque no se puede probar, es muy poco probable que Google use LSI. Lo sé, siempre habrá quienes quieran creer lo contrario, al igual que hay personas que creen que la tierra es plana, que Estados Unidos nunca fue a la luna y que Elvis todavía está vivo.

Si bien sabemos que Google realiza un análisis semántico del texto, no se puede concluir que, por lo tanto, utilice un análisis semántico latente. Esa afirmación es un gran salto en la lógica.

Aquí está el otro problema.

Un desafío importante de la tecnología LSI es la cuestión de la escalabilidad y el rendimiento. Este primer intento de procesamiento de lenguaje natural fue diseñado para funcionar en un conjunto comparativamente pequeño de documentos estáticos. Nunca fue creado para manejar grandes cantidades de contenido en constante cambio como el que tenemos en la Web. De hecho, la patente para el análisis semántico latente se presentó en 1988, casi tres años antes de que la web se pusiera en marcha.

Sin mencionar que existen algunos inconvenientes en el uso del análisis semántico latente:

  • El modelo tiene dificultad para lidiar con la polisemia (múltiples significados de una palabra). Por ejemplo, una grúa podría ser una pieza de construcción o un pájaro de cuello largo.
  • Ignora el orden de las palabras, por lo que se pierde las relaciones sintácticas, la lógica y la morfología.
  • Asume una distribución particular (gaussiana) de términos en documentos que puede no ser cierta en todos los casos.
  • Es computacionalmente intensivo y difícil de actualizar continuamente con nuevos datos.

Aquí hay algo más a considerar. Google patentó un enfoque de vector de palabras (pdf), otorgado en 2017, capaz de manejar un corpus de miles de millones de palabras con millones de palabras en el vocabulario. ¡Ese es exactamente el tipo de potencia de fuego que necesita cuando analiza contenido en la web!

Es seguro decir que las tecnologías que usa Google para indexar el contenido web y comprender ese contenido han avanzado considerablemente desde sus inicios.

LSI es ruedas de entrenamiento para motores de búsqueda.

Roger Montti

Diario del motor de búsqueda

¿Por qué usar tecnología antigua cuando puedes usar algo no solo mejor sino más rápido?

¿Pueden sus esfuerzos de optimización de motores de búsqueda beneficiarse del análisis semántico latente?

Realmente no. Primero, veremos por qué es así y luego veremos un mejor enfoque.

Es posible que haya encontrado sitios web que ofrecen "palabras clave LSI" gratuitas. Desafortunadamente, no brindan ninguna información sobre cómo usan LSI para generar sus resultados. Por lo que he visto, la calidad de la salida no es tan buena. Lo que ofrecen no son necesariamente temas relacionados, sino variantes.

Lista de palabras clave de LSI para el término "indexación semántica latente y SEO".
Palabras clave de LSI para el término de búsqueda "indexación semántica latente y SEO"

Hay otra cuestión a considerar también.

Cuando se trata de indexación semántica latente y SEO, el consejo que he visto básicamente se reduce a "rociar" su contenido con algunas de estas palabras clave LSI, que en realidad son solo sinónimos. La lógica detrás de este consejo es que el uso de estos sinónimos fortalece la relevancia temática de su contenido. Eso tiene que ser bueno para el SEO, ¿verdad?

No tan rapido.

Esto de intercambiar palabras se parece mucho al relleno de palabras clave/la madriguera del conejo de densidad que muchos SEO se aventuraron no hace mucho tiempo.

Como se mencionó anteriormente, no hay evidencia de la cual podamos concluir que Google usa LSI. De hecho, el motor de búsqueda ciertamente está a años luz en la tecnología que utiliza para comprender las páginas web y establecer la relevancia semántica.

Entonces, deja de confiar en la tecnología de los 80. No sea esa persona que no renunciará a su VCR Betamax.

Haz esto en su lugar.

  • Deja de buscar formas de hacer que Google piense que tu contenido es mejor de lo que realmente es.
  • Concéntrate en tu audiencia y crea un gran contenido.
  • Emplee una mejor plataforma de modelado de temas (pruebe MarketMuse).
  • Use su aplicación de investigación para derivar una lista de temas relacionados semánticamente. Simplemente escriba un tema (generalmente una consulta de búsqueda) y obtendrá una lista de 50 temas relacionados ordenados por relevancia.
  • Examine cuidadosamente esa lista para determinar la historia detrás del tema. Estructure la publicación del blog con subtítulos que capturen la esencia del tema.
Modelo de tema de MarketMuse para el tema "indexación semántica latente y SEO".
Aplicación de investigación de MarketMuse
  • Complete los detalles de cada sección, abordando todos los conceptos relevantes y agregando contexto.
  • Utilice la aplicación de preguntas para ayudar a comprender mejor la intención del usuario detrás del término de búsqueda al que se dirige.
  • Obtenga una nueva perspectiva de sus esfuerzos de optimización en la página. La aplicación Optimize de MarketMuse indica qué tan bien cubrió el tema. Obtenga comentarios inmediatos sobre su escritura para determinar si ha logrado la puntuación de contenido y el recuento de palabras deseados. Sabrás el potencial de tu contenido, incluso antes de presionar el botón de publicar.

Su estrategia de SEO no debe ejecutarse en la tecnología de 1980, a menos que sea del tipo que disfruta usando un IBM-XT con MS-DOS. ¿Quien soy yo para decir? Dentro de unos años, es posible que todos nos estemos riendo de LSI al igual que lo hacemos con la densidad de palabras clave.

lo que debes hacer ahora

Cuando esté listo... aquí hay 3 formas en que podemos ayudarlo a publicar mejor contenido, más rápido:

  1. Reserve tiempo con MarketMuse Programe una demostración en vivo con uno de nuestros estrategas para ver cómo MarketMuse puede ayudar a su equipo a alcanzar sus objetivos de contenido.
  2. Si desea aprender cómo crear mejor contenido más rápido, visite nuestro blog. Está lleno de recursos para ayudar a escalar el contenido.
  3. Si conoce a otro profesional del marketing al que le gustaría leer esta página, compártala por correo electrónico, LinkedIn, Twitter o Facebook.