Войти
БлогТекстовая оптимизация

Какие зоны документа влияют на текстовую релевантность

2021-09-29
2395
(271)
Какие зоны документа влияют на текстовую релевантность

Все мы знаем, что определение текстовой релевантности документа запросу пользователя - базовая задача поисковых систем, методы решения которой постепенно улучшаются и развиваются. Но нам на практике и по сей день нужно делать вхождения в документе, пускай уже и не только продвигаемой фразы, а раскрывающих тематику слов и фраз.

Но где именно в документе мы можем делать эти вхождения? В Title, в Meta-Description, во внутренних ссылках или может быть в микроразметке? Чтобы разобраться в этом я провел эксперимент и определил какие зоны документа влияют на текстовую релевантность в Яндексе и Google, а какие - нет.

Суть эксперимента

Для проведения эксперимента мной был создана отдельная страница, на которой добавлены во все известные зоны документа уникальные слова вроде “relexp4815link” или “relexp4815h1”, не встречающиеся в коллекции документов поиска.

После того как страница была проиндексирована и какое-то время существовала в индексе, был использован цитатный поиск по добавленным в разные зоны фразам. Если документ находился, то эта зона документа влияет на текстовую релевантность. Эксперимент довольно простой и любой из вас его может повторить.

Основные зоны документа

В первую очередь давайте рассмотрим результаты эксперимента для самых популярных зон, оптимизацией которых мы занимаемся, пожалуй, в первую очередь. В таблице используется сокращение "ЦП", оно значит находится ли страница в цитатном поиске.

Зона документа ЦП Яндекс ЦП Google
Тег Title Да Да
Мета-тег Title Нет Нет
Мета-тег Description Нет Нет
Мета-тег Keywords Нет Нет
Заголовки H1..H6 Да Да
Видимый текст Да Да
Скрытый текст (display: none) Да Да
Исходящая ссылка (анкор) Да Да
Входящая внутренняя ссылка (анкор) Нет Нет

Как видно, не стоит пытаться добавить в мета-тег Description какие-то продвигаемые фразы ради повышения текстовой релевантности документа, это не сработает. Продвигаемые фразы мы туда включаем чтобы содержимое мета-тега Description было с высокой вероятностью показано пользователю в сниппете.

Если вы не поняли в чем отличие между Title и мета-тегом Title, то вот как они выглядят (второй вариант частенько попадается на сайтах):

<title>Title здорового человека</title>

<meta name="title" content="Title курильщика" />

Вопросы тут остались только по использованию мета-тега Keywords Яндексом, так как в своей документации поисковая система пишет что он "может использоваться". Быть может это именно тот случай когда он не использовался.

Популярная микроразметка

Для эксперимента уникальные слова были добавлены и в популярные типы микроразметки для социальных сетей (Open Graph и Twitter Card), а также популярные типы разметки контента сайта (Product и BreadcrumbList), реализованные посредством Microdata (не через JSON-LD, так как его не читает Яндекс).

Поле микроразметки ЦП Яндекс ЦП Google
Title (Open Graph) Нет Нет
Description (Open Graph) Нет Нет
Site Name (Open Graph) Нет Нет
Title (Twitter Card) Нет Нет
Description (Twitter Card) Нет Нет
Title (Product) Нет Нет
Description (Product) Нет Нет
Name (BreadcrumbList) Нет Нет

Как видно, содержимое микроразметки не используется для определения текстовой релевантности ни Яндексом, ни Google. Видимо, её роль лишь для формирования привлекательных сниппетов (как и у мета-тега Description), а также для определения типа контента страницы.

Как с этим жить

Как следует из эксперимента, включать продвигаемые и тематические фразы для получения текстовой релевантности нужно в Title, заголовки, текст (пускай и скрытый), а также в анкоры исходящих со страницы ссылок.

Уверен, эксперимент оказался вам полезен. А я уже приступаю к следующему..

Оцени статью
Комментарии
Евгений
2021-09-30
Уточнение. Яндекс уже частично читает ld-json. Недавно они дополнил документацию
Илья Горбачев
2021-09-30
Евгений, спасибо за дополнение! Действительно, теперь поиск Яндекса научился читать JSON-LD. Жаль что пока только хлебные крошки.
Константин
2021-09-30
Ч правильно понял по поводу исходящей ссылки? То есть, в статье под ключ “relexp4815h1”, должна быть ссылка на статью с другого сайта с анкором “relexp4815h1”?
Илья Горбачев
2021-09-30
Все верно. Получается страница донора также получает плюс к текстовой релевантности содержимому анкора исходящей ссылки.
Александр Денисов
2021-10-21
"какое-то время существовала в индексе" — сколько примерно времени?
Илья Горбачев
2021-10-21
Где-то 5-6 недель.
Александр Денисов
2021-10-21
И ещё вопрос: эксперимент основывается на тезисе, что в текстовом ранжировании участвует только текст, который найден по цитатному поиску. Я тоже придерживаюсь этого тезиса, но интересно твоё подтверждение.
Илья Горбачев
2021-10-21
Все верно. А ещё чтобы не ограничиваться цитатным поиском нашпиговал все перечисленные зоны уникальными словами вроде "relexp4815h2". И результаты для них получились те же.
Евгений
2021-11-07
Спасибо за эксперимент. Ещё вопрос по исходящим ссылкам. Вот мы со страницы про Ёжиков ссылается на страницу Медведи с анкором "медведи". По логике ссылочного ранжирования страница Медведи должна быть выше в поиске по запросу "медведи". Так а о чем говорят результаты эксперимента? Что страница Ёжики будет ранжироваться выше чем Медведи по запросу "медведи" ?
Илья Горбачев
2021-11-09
Все верно, результаты эксперимента такие что слово "Медведь" не передаст анкорный вес странице с медведями. Но как мне кажется просто ссылочный граф не успел обновиться и учесть ссылку или поисковая система посчитала её не сильно значимой.
Олег
2023-02-12
Разметка помогает в 1 очередь меньше тратить денег дата центрам на обработку сайтов а . Ну и потом уже понимание структуры и за это уже профит сайт) Из плюшек Ну к примеру через разметку удавалось указывать реальный размер картинок если обычными методами сохраняет размеры меньшего размера.
Оставить комментарий
Отправить