Скрытое семантическое индексирование для SEO? Оптимизация вашего контента заслуживает лучшего
Опубликовано: 2019-04-17Вы помните ту сцену в «Матрице», где Морфеус (Лоуренс Фишбёрн) протягивает по капсуле на каждой ладони, описывая выбор, стоящий перед Нео (Киану Ривз)?
Он говорит: «Это твой последний шанс. После этого пути назад нет. Принимаешь синюю таблетку — история заканчивается, ты просыпаешься в своей постели и веришь во что хочешь. Примешь красную таблетку — останешься в Стране Чудес, а я покажу тебе, как глубока кроличья нора. Помните: все, что я предлагаю, это правда. Ничего больше."
Этот пост в блоге — вроде того. В этом случае мы будем говорить о скрытой семантической индексации, а именно:
- Что это
- Почему он так популярен среди SEO-специалистов
- Если Google использует его
- Помогает ли это вашим усилиям по SEO
В конце концов, как и Нео, вы можете верить во что угодно. Итак, приступим. (в очереди напряженная музыкальная тема)

Что такое скрытое семантическое индексирование (LSI)?
В мире SEO латентное семантическое индексирование (LSI) и латентный семантический анализ (LSA) являются взаимозаменяемыми терминами. Мы не собираемся вдаваться в подробности об их различиях, поэтому в этом посте будем следовать той же практике.
LSI — это метод, который анализирует отношения между набором документов и содержащимися в них терминами. В основе лежит предположение о том, что слова, близкие по значению, будут встречаться в похожих фрагментах текста (известное как гипотеза распределения). Он основан на математическом методе, называемом разложением по сингулярным числам, для определения этих отношений.
Для тех, кто заинтересован, вот отличный пример скрытой семантической индексации (pdf), на который вы можете сослаться.
Не переживайте, если математика вам не по душе. Вам не нужно ценить технические нюансы процесса.
Важно понимать, что LSI была создана для индексации содержимого коллекций документов с нечастыми обновлениями.
Почему это имеет значение? Мы вернемся к этому позже.
Во-первых, давайте попробуем понять, как LSI стала такой важной в мире SEO.
Ключевые слова LSI и их популярность среди SEO-специалистов
Кажется, мир поисковой оптимизации проходит этапы, когда конкретная стратегия становится популярной. В какой-то момент это было наполнение ключевыми словами, практика, когда определенные фразы повторялись до отвращения в сообщении в блоге. По общему признанию, это не сделало ничего, чтобы улучшить содержание. Но это работало до тех пор, пока поисковые системы не подхватили эту тактику.
Следующее «продвижение» SEO на странице касалось плотности ключевых слов. Вместо того, чтобы без разбора набивать ключевыми словами, каждый эксперт по поисковой оптимизации проповедовал свое мнение о том, сколько ключевых фраз можно вставить в статью, чтобы вас не поймали.
Оглядываясь назад, вы не можете не смеяться над тщетностью всего этого. Но тогда это был серьезный бизнес. Удивительно, но эта абсолютно бесполезная SEO-стратегия продолжает вызывать интерес!
Вот еще один из тех методов SEO, о которых я хочу вас предупредить.
Есть SEO-эксперты, которые утверждают, что Google использует какую-то форму технологии LSI. Хотя я не уверен, кто начал этот SEO-эквивалент городской легенды, одно можно сказать наверняка. Многие говорят об этом, как будто это факт.

Думаю, это не удивительно. Когда несколько известных влиятельных лиц в индустрии SEO используют этот термин и начинают заявлять, что оптимизация LSI помогает стимулировать органический трафик, толпа обязательно последует за ними.
На первый взгляд, идея о том, что LSI ведет к успеху в SEO, кажется правдоподобной. Мы знаем, что Google интересуется семантикой — пониманием естественного языка и пониманием скрытого смысла слов на странице. Вот так и говорят.
Кроме того, если вы являетесь SEO-компанией и пытаетесь продавать заурядные SEO-услуги по более высокой цене, использование таких терминов и фраз, как скрытое семантическое индексирование, заставляет вас выглядеть очень умным (и дорогим).
Кроме того, сколько алгоритмов тематического моделирования будет понимать средняя команда цифрового маркетинга? Вероятно, где-то между нулем и единицей.
Кроме того, латентное семантическое индексирование звучит намного привлекательнее, чем термин «частотно-обратная частота документа» (TF-IDF) или латентное распределение Дирихле (LDA).
Тем не менее остается вопрос.
Используют ли поисковые системы скрытое семантическое индексирование?
Хотя это невозможно доказать, очень маловероятно, что Google использует LSI. Я знаю, всегда найдутся те, кто хочет верить в обратное — точно так же, как есть люди, которые верят, что Земля плоская, Америка никогда не летала на Луну, а Элвис все еще жив.
Хотя мы знаем, что Google проводит семантический анализ текста, нельзя сделать вывод, что поэтому они используют скрытый семантический анализ. Это утверждение является серьезным скачком в логике.
Вот еще одна проблема.
Основной проблемой технологии LSI является проблема масштабируемости и производительности. Эта ранняя попытка обработки естественного языка была разработана для работы со сравнительно небольшим набором статических документов. Он никогда не создавался для работы с большими объемами постоянно меняющегося контента, как в Интернете. На самом деле, патент на латентный семантический анализ был подан в 1988 году, почти за три года до появления Интернета.
Не говоря уже о некоторых недостатках использования латентного семантического анализа:
- Модель испытывает трудности с полисемией (многозначностью слова). Например, журавль может быть частью конструкции или птицей с длинной шеей.
- Он игнорирует порядок слов, упуская из виду синтаксические отношения, логику и морфологию.
- Он предполагает определенное распределение (по Гауссу) терминов в документах, которое может быть неверным во всех случаях.
- Это требует больших вычислительных ресурсов, и их сложно постоянно обновлять новыми данными.
Вот еще кое-что, чтобы рассмотреть. Google запатентовал подход вектора слов (pdf), предоставленный в 2017 году, способный работать с корпусом из миллиардов слов с миллионами слов в словаре. Это именно та огневая мощь, которая вам нужна при анализе контента в Интернете!

Можно с уверенностью сказать, что технологии, которые Google использует для индексации веб-контента и понимания этого контента, значительно продвинулись вперед с момента своего появления.
LSI обучает поисковые системы.
Роджер Монтти
Журнал поисковой системы
Зачем использовать старые технологии, когда можно использовать что-то не только лучше, но и быстрее?
Могут ли ваши усилия по поисковой оптимизации извлечь выгоду из скрытого семантического анализа?
Не совсем. Сначала мы рассмотрим, почему это так, а затем рассмотрим лучший подход.
Возможно, вы сталкивались с веб-сайтами, предлагающими бесплатные «ключевые слова LSI». К сожалению, они не предоставляют никакой информации о том, как они используют LSI для получения своих результатов. Судя по тому, что я видел, качество вывода не очень. То, что они предоставляют, не обязательно является связанными темами, поскольку они являются вариантами.

Есть еще один вопрос, который следует учитывать.
Когда дело доходит до скрытого семантического индексирования и SEO, совет, который я видел, в основном сводится к тому, чтобы «рассыпать» ваш контент некоторыми из этих ключевых слов LSI, которые на самом деле являются просто синонимами. Обоснование этого совета заключается в том, что использование этих синонимов усиливает тематическую актуальность вашего контента. Это должно быть хорошо для SEO, верно?
Не так быстро.
Эта штука с заменой слов сильно пахнет кроличьей норой наполнения/плотности ключевыми словами, в которую многие SEO-специалисты отважились залезть не так давно.
Как упоминалось ранее, нет никаких доказательств того, что Google использует LSI. На самом деле, поисковая система, безусловно, опережает на световые годы технологию, которую она использует для понимания веб-страниц и установления семантической релевантности.
Так что перестаньте полагаться на технологии 80-х. Не будьте тем человеком, который не откажется от своего видеомагнитофона Betamax.
Сделайте это вместо этого.
- Перестаньте искать способы заставить Google думать, что ваш контент лучше, чем он есть на самом деле.
- Сосредоточьтесь на своей аудитории и создавайте отличный контент.
- Используйте лучшую платформу для тематического моделирования (попробуйте MarketMuse).
- Используйте его исследовательское приложение для получения списка семантически связанных тем. Просто введите тему (обычно поисковый запрос), и вы получите список из 50 связанных тем, отсортированных по релевантности.
- Внимательно изучите этот список, чтобы определить историю, лежащую в основе темы. Структурируйте сообщение в блоге, используя подзаголовки, которые отражают суть темы.

- Заполните детали каждого раздела, обращаясь ко всем соответствующим понятиям и добавляя контекст.
- Используйте приложение «Вопросы», чтобы лучше понять намерения пользователя, стоящие за поисковым запросом, на который вы ориентируетесь.
- Получите новый взгляд на свои усилия по оптимизации на странице. Приложение MarketMuse Optimize показывает, насколько хорошо вы рассмотрели тему. Получите немедленную обратную связь о своем письме, чтобы определить, достигли ли вы целевого уровня содержания и количества слов. Вы узнаете потенциал своего контента еще до того, как нажмете кнопку публикации.
Ваша SEO-стратегия не должна основываться на технологии 1980-х годов, если только вы не относитесь к тому типу людей, которым нравится использовать IBM-XT под управлением MS-DOS. Кто я такой, чтобы сказать? Через несколько лет мы все будем смеяться над LSI точно так же, как над плотностью ключевых слов.
Что вы должны сделать сейчас
Когда вы будете готовы... вот 3 способа, которыми мы можем помочь вам публиковать более качественный контент и быстрее:
- Забронируйте время с MarketMuse Запланируйте живую демонстрацию с одним из наших специалистов по стратегии, чтобы увидеть, как MarketMuse может помочь вашей команде достичь своих целей в отношении контента.
- Если вы хотите узнать, как быстрее создавать качественный контент, посетите наш блог. Он полон ресурсов, помогающих масштабировать контент.
- Если вы знаете другого маркетолога, которому было бы интересно прочитать эту страницу, поделитесь ею с ним по электронной почте, LinkedIn, Twitter или Facebook.
