Группировка слов онлайн. Делаем правильно кластеризацию семантического ядра

В небольшом SEO-отделе большого контентного проекта, где я работаю, решили увеличить штат. Набирать планировалось людей с небольшим опытом или совсем без опыта. По этой причине было решено создать некий гайд, который бы служил исчерпывающим руководством по написанию новых статей. Руководство получилось действительно подробным и полным, один из его важных блоков – это кластеризация запросов.

Зачем нужны сервисы кластеризации?

В один кластер должны быть объединены только такие запросы, которые имеют хорошие шансы выйти в топ-10 поисковых систем с общей релевантной страницей. То есть, если по двум запросам в выдаче все страницы сайтов разные и нет пересечений, то следует относить их к разным кластерам. Также и наоборот: если два запроса возможно продвинуть на одной статье, то не следует разносить их на разные кластеры, чтобы не писать лишнего – бюджет на контент не резиновый.


Общая схема составления ТЗ на написание SEO-статьи следующая:

  1. Сбор семантики – статистика поисковых систем, базы семантики, внутренняя статистика проекта;
  2. Кластеризация автоматическая – сервис или программа для кластеризации по подобию топов;
  3. «Посткластеризация» ручная – обработка того что не удалось кластеризовать автоматически;
  4. Приоритезация – определение важности полученных запросов в каждом кластере;
  5. Оформление ТЗ для копирайтера – лемматизация, LSI и различные указания для написания статей, по статье на каждый кластер.

Вот именно для второго пункта нужно было выбрать самый подходящий сервис автоматической кластеризации. Для этой цели я провел сравнительный анализ самых известных, на мой взгляд, сервисов.

Способы кластеризации

Из способов, которые автоматизированы в каких-то известных сервисах или программах, можно выделить два:

  • По подобию топов (по поисковой выдаче);
  • По .
Исходя из задачи – написание SEO-статей, был выбран метод по подобию топов. Поисковая система на трафик с которой мы ориентируемся – Яндекс, поэтому для кластеризации использовался топ-10 Яндекса. У данного метода есть два вида:
  • Soft – когда все запросы кластера связаны хотя бы с одним общим (маркерным) запросом;
  • Hard – когда каждый запрос связан со всеми запросами в своем кластере;
а также такой параметр как «сила связи» – количество общих URL в поисковой выдаче по запросам.

По рекомендациям создателей сервисов кластеризации для нашего случая был выбран вариант Soft с силой связи 4. Это важный момент, потому что для интернет-магазина, например, следовало бы выбирать другие опции.

Методика сравнения

Суть сравнения сервисов в следующем: выбрать идеально кластеризованный список запросов – эталонное ядро. Сравнить результаты кластеризации каждого сервиса с эталонным.


Важно было хорошо составить такое эталонное ядро. Поскольку у нас контентный проект и большая часть контента – это вопросы и ответы пользователей, то материала для сбора статистики по проекту предостаточно.


Было взято ядро на 2500+ ключевых фраз, которое отслеживается уже много месяцев. Из него выбраны только запросы вышедшие в топ-5 Яндекса. И из них взяты только те которые имеют релевантной страницу одного из широких разделов (категория вопроса, тема вопроса, категория документа, страница с формой «задать вопрос»), а не узкую страницу вопроса с ответами. Запросы были сгруппированы по релевантной странице. Оставлены только группы в которых более чем 4 запроса. В итоге получилось 292 запроса разбитых на 22 кластера.


Забегая вперед скажу, что сравнивались результаты кластеризации по Московской выдаче Яндекса и без геопривязки. Региональная московская выдача показала себя лучше, поэтому далее будем говорить про нее.

Сравнение сервисов

В поиске самых популярных сервисов очень помог доклад Александра Ожгибесова на BDD-2017, к тем, что у него было добавлено еще несколько сервисов, получился такой список:

  1. Топвизор
  2. Pixelplus
  3. Serpstat
  4. Rush Analytics
  5. Just Magic
  6. Key Collector
  7. MindSerp
  8. Semparser
  9. KeyAssort
  10. coolakov.ru

Первое на что проверялись полученные в результате кластеризации эталонного ядра по этим сервисам группы – это не делает ли сервис слишком широкие группы. А именно не попали ли запросы из разных групп эталонного ядра в один кластер по версии сервиса.


Но только такого сравнения не достаточно. Сервисы делятся на два подхода к некластеризованному остатку фраз:

  • сделать для них общую группу «Некластеризованные»;
  • сделать для каждой некластеризованной фразы группу из нее одной.
По причине п.2 появилась необходимость смотреть на количество фраз, которые находятся в одной группе эталонного ядра и попали в разные по сервисам.

В сравнении я использовал оба этих параметра в виде соотношения – какой процент фраз от общего количества попал не в свою группу.


Результаты сравнения:

  • Топвизор
    • разные группы эталона в одной по сервису – 4%
  • Pixelplus
    • одна группа эталона в разных по сервису – 7%
  • Serpstat
    • разные группы эталона в одной по сервису – 0%
  • Rush Analytics (132 фразы, demo)
    • разные группы эталона в одной по сервису – 11%
    • одна группа эталона в разных по сервису – 8%
  • Just Magic
    • разные группы эталона в одной по сервису – 0%
    • одна группа эталона в разных по сервису – 9%
  • Key Collector
    • разные группы эталона в одной по сервису – 12%
    • одна группа эталона в разных по сервису – 16%
  • MindSerp – не удалось получить демо, не выходят на связь
  • Semparser
    • одна группа эталона в разных по сервису – 3%
  • KeyAssort
    • разные группы эталона в одной по сервису – 1%
    • одна группа эталона в разных по сервису – 1%
  • coolakov.ru
    • разные группы эталона в одной по сервису – 0%
    • одна группа эталона в разных по сервису – 18%

Итоги

В качестве оптимального решения для нашего проекта была выбрана программа KeyAssort – это именно программа, а не онлайн-сервис, лицензия покупается однократно, привязывается к железу.


Неплохие результаты показал популярный онлайн сервис Serpstat, но для нашего случая чуть хуже, а также значительно дороже. Если брать большие объемы запросов в месяц и использовать его только для кластеризации – он не рентабелен. Возможно, если использовать кластеризатор вместе с другими его инструментами, то он и окажется приемлемым по цене.


Самые худшие показатели у программы Key Collector, что все равно не отменяет необходимость ее иметь в своем арсенале для любого сеошника.


Очень удивил сервис MindSerp, через сайт которого я так и не смог получить никакой обратной связи по поводу демо. Если представители этого сервиса прочитают статью, может быть я добавлю в сравнение и его)

Теги: Добавить метки

Предлагаем две бесплатные программы для Windows:

  • Majento Кластеризатор, аналогичный нашему онлайн-сервису, с возможностью ручной группировки фраз
  • кластеризатор ядра запросов на основе Excel-кластеризатора по леммам от Roman Igoshin

Majento Кластеризатор 1.4

Программа является копией нашего онлайн-сервиса, однако имеет дополнительный функционал в виде ручной группировки фраз, доступной после автоматической кластеризации поисковых запросов. Сбор данных для кластеризации берется из выдачи Яндекса и ведется с использованием лимитов Яндекс.XML . После кластеризации становится доступной функция ручной группировки запросов (перемещение запросов по группам, создание новых групп и удаление кластеров). Результаты кластериции запросов экспортируются в Excel-файл формата CSV.

В программе имеется возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов (пример файла импорта приложен в архиве).


Основные возможности

  • Кластеризация произвольного списка запросов
  • Указание региона в Яндекс для сбора данных при кластеризации
  • Группировка запросов методами Soft и Hard, "ручное" указание порога кластеризации фраз (от 1 до 10)
  • Возможность произвольной группировки фраз
  • Импорт данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов
  • Экспорт кластеризации в Excel (CSV)

Отличия от аналогов

  • Низкие требования к ресурсам компьютера, малый расход оперативной памяти
  • Кластеризация ядер любых объемов
  • Портативный формат (работает без установки на ПК или прямо со сменного носителя)
  • Бесплатное распространение

Помощь проекту

Если у вас есть желание поддержать развитие программы, вы можете перевести любую сумму одним из удобных для вас способов:

  • на кошелек WebMoney: R848899779227 (перевод производится без протекции сделки).
  • на кошелек Яндекс.Деньги (форма ниже):

Благодарим за поддержку!

История версий

Версия 1.4 (build 33), 23.11.2017:

  • добавлено отображение числа главных страниц по каждому запросу и по группе запросов в целом

Версия 1.3 (build 31), 27.09.2017:

  • добавлена возможность просмотра наиболее часто встречающихся сайтов в конкретном кластере
  • расширен список регионов Яндекс, добавлена возможность их редактирования в текстовом файле (regions.txt)
  • исправлена ситуация, когда в поле списка запросов не загружалось более 2000 строк

Версия 1.2 (build 28), 29.08.2017:

  • добавлена возможность указания региона в Яндекс для сбора данных при кластеризации
  • добавлена возможность "ручного" указания порога кластеризации фраз (от 1 до 10)
  • добавлена возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов

Версия 1.1 (build 22), 10.08.2017:

  • добавлена возможность ручной группировки фраз
  • добавлена возможность экспорта кластеризованных групп в Excel (CSV)

Версия 1.0 (build 5), 07.06.2016:

  • возможность кластеризации по запросам из списка
  • возможность группировки запросов методами Soft и Hard

Минимальные системные требования:
- 500 МГц (рекомендуется: 1 ГГц или выше)
- 1 ГБ RAM (рекомендуется: 2 ГБ или выше)
- Microsoft Windows XP/2003/Vista/7-10
- выход в интернет

Кластеризатор по леммам

Исходя из статьи Романа Игошина (http://www.it-agency.ru/academy/excel-clusterer/), идея заключалась занести данные в таблицу, а потом уже вручную играться с параметрами, добиваясь нужного результата. Так что если идти по этому пути, то программа явно проигрывает с точки зрения удобства.

Возможно, правильней было бы улучшить изначальную идею - дописать и оптимизировать скрипты для экселя...
Поэтому полученный софт выкладывается "как есть". Если будут мысли, как докрутить до рабочего варианта - вэлкам.

Скачать кластеризатор по леммам: majento-clusterer.zip (7 Мб)

PS. Описание настроек см. в ридми + примеры включены.
PPS. Для небольшого списка запросов нужно уменьшить мин. вес до 1000000 (по логике, чем меньше запросов, тем меньше должен быть вес).

Ограничение: 5 раз в сутки для 1 IP-адреса. Для Вашего IP осталось 5 раз. Зарегистрируйтесь, чтобы снять ограничение...

Запросы для онлайн кластеризации (макс. 250) ↓


Примечание: знаки "+" из текста удаляются автоматичски

Метод кластеризации: SOFT HARD

Подобрать релевантную страницу


Защита от автоматических генераций:


Используется два метода кластеризации: Soft и Hard.

  • Soft -кластеризация: выбирается "центральный" запрос с которым сравниваются остальные запросы по количеству общих URL в ТОП-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляется в группу.
  • Hard -кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL, который показывается по ВСЕМ этим запросам в ТОП-10.

При использовании сервиса кластеризации без регистрации действует ограничение - не более 250 фраз за один раз. Зарегистрированные пользователи могут группировать запросы до 500 фраз единоразово любое количество раз.

Добрый день, уважаемые читатели! Все мы знаем, что сбор поисковых запросов — это фундамент для успешной seo-раскрутки любого веб-ресурса в Яндексе и Гугле. Но как показывает практика, этот этап поискового продвижения у многих не очень получается. Поэтому на своих «Записках» я периодически выдаю практические материалы на эту тему. Сейчас поговорим о том, как проводить грамотную кластеризацию семантического сайта или блога своими руками. В статье Вы поймете важность этого процесса, увидите варианты его выполнения, узнаете способы группировки ключевых слов.

  1. Первым делом мы формируем — словосочетаний, которые затем лягут в основу будущих ключевых слов.
  2. На этапе парсинга мы получаем весь пул поисковых запросов по нашей теме, .
  3. С помощью найденных параметров , вычищаем будущее семантическое ядро.
  4. Имея список всех найденных ключевиков сайта наступает этап их распределения по страницам нашего веб-ресурса.

Кластеризация ключевых слов сайта

Именно последний шаг в создании семантического ядра вызывает много вопросов. Дело в том, что первые этапы (кроме первого) более менее автоматизированы. Не нужно много усилий, чтобы провести сбор запросов и сделать их анализ. А вот этап группировки ключевых слов требует от веб-мастера максимум временных и умственных затрат. Поэтому и возникают различные ошибки. Наша с Вами задача — их не допустить!

Что такое группировка ключевых слов

Группировка (или кластеризация) ключевых слов — это процесс распределения поисковых запросов одной тематики (группа запросов) для продвижения одной страницы. Почему одной? Ответ Вы найдете в моем практическом .

Другими словами, с помощью этого этапа найденные словосочетания формируем в отдельные смысловые группы. Каждая группа внедряется только на свою продвигаемую страницу и решает одну задачу (общую для всех запросов этой группы):

  • дает ответ на вопрос пользователя из поисковых систем (блоги, инфо-сайты);
  • предлагает коммерческие данные по конкретным товарам (интернет-магазины);
  • выдает информацию по услуге (коммерческие сайты, специализированные порталы).

Таким образом, все запросы группы соответствуют главной теме конкретной целевой страницы. Все они раскрывают цель конкретного документа сайта с той или иной стороны.

Более детально о понятии кластеризации семантического ядра Вы можете изучить . В нем Вы найдете историю появления этого вида seo-работы, увидите наглядный пример по группировке запросов.

Еще под кластеризацией поисковых запросов понимается автоматизированный сбор фраз путем взаимодействия сервиса со страницами в поисковых выдачах. Об этом я подробнее расскажу, когда речь пойдет об одноименной услуге Топвизора.

Что дает грамотная кластеризация ключей для сайта

Каждая найденная группа запросов — это не только ключевики для контента целевой страницы. Понятное дело, что их нужно внедрить в документ сайта (информационный пост блога, карточка товара интернет-магазина и т.д.). Кроме этого кластеризация запросов позволяет получить:

  • видение будущей полноценной структуры нового сайта (или старого);
  • путеводитель по темам, которые интересны пользователям из поиска;
  • понимание текущего спроса на товары/услуги в конкретной нише;
  • план seo-продвижения (какой контент формировать в первую очередь);
  • материал, из которого видны запросы для оптимизации страницы.

Поясню один важный момент. Кластеризация в группы дает колоссальную возможность использовать все ресурсы для привлечения максимального поискового трафика! Не делая группировку поисковых запросов, мы тем самым отсекаем свой сайт от освящения тем, которые нужны пользователям из Яндекса и Гугла.

Что сулит неправильное распределение ключевиков

Итак, не имея распределенных групп по большой теме, владелец веб-ресурса не видит полноту всей картины продвижения. Это самая большая проблема, которая возникает при игнорировании этапа кластеризации (или ее неполноценного совершения).

Но даже наличие этого шага в Вашем плане продвижения не может гарантировать Вам достижения всех назначенных seo-задач. Это может произойти из-за ошибок, которые возникают при группировке запросов на целевые страницы. Вот проблемы, которые дает неправильное распределение ключевых слов:

  • появление дублей в индексах поисковых систем (за счет каннибализации);
  • потеря или не получение мест в первой десятке поисковой выдачи;
  • потеря денег, затраченных на формирование «лишнего» контента;
  • ухудшение поведенческих факторов, не достижение поставленных целей.

Как говорил один известный киношный персонаж «Картина маслом». По-другому тут и не скажешь. В современном поисковом продвижении нельзя делать «чуть-чуть» или оставлять что-то на потом. Все нужно выполнять вовремя и со смыслом. Кластеризация семантического ядра — это тот этап, после которого на скелет сайта нанизывается «мясо» (контент). И здесь любая ошибка превращает seo-раскрутку сайта в настоящий апокалипсис. Проблемы возникают там, где их не ждут.

Способы группировки семантического ядра

Для формирования групп ключевых слов семантики сайта используют ручной и/или автоматизированный способы. Первый самый рутинный и сложный. Зато самый надежный — нет лучшего проверяльщика и корректора, чем человек.

Ручной способ очень трудоемок. Одно дело, распределить 500 запросов на ряд статей новой темы. Другое дело, когда нужно просканировать 10 000 ключевиков и сформировать из них подобающие группы. Тут нужна выдержка и терпение.

Автоматизированный способ почти всю рутину берет на себя — вебмастеру или специалисту остается только проверить результат кластеризации. Но зато возникают другие сложности — часть запросов стоит не в своих группах, логика распределения может отличаться от той, которую представляет себе человек.

Чтобы как-то нивелировать иногда «туповатую» логику машины, используется полуавтоматический способ распределения СЯ сайта. В этом случае специалист заранее формирует общие группы согласно найденным запросам. А автоматика распределяет запросы уже в самих этих группах. Таким образом ошибок распределения намного меньше.

Теперь рассмотрим каждый способ кластеризации семантического ядра, используя самые лучшие инструменты (на мой взгляд, конечно).

Автоматизированный способ группировки СЯ сайта

Автоматических вариантов кластеризации поисковых фраз в настоящее время существует очень много. Все они отличаются интерфейсом, даже есть отличия в самом процессе распределения. Более детально о современных инструментах группировки СЯ веб-ресурса можно узнать в обзорной статье Александра Алаева . Я же разберу только два варианта, которыми пользуюсь сам и считаю их самыми лучшими.

Анализ групп в программе Key Collector

Key Collector — это самый лучший софт для создания семантического ядра. Разумеется, у него есть и свой способ распределения запросов — инструмент «Анализ групп». Он позволяет разбить все найденные поисковые запросы. Вот схема работы с ним.

Выбираем инструмент «Анализ групп»

Допустим, нам необходимо сделать распределение спарсенных запросов по теме камер видеонаблюдения. Для этого нажимаем соответствующую иконку на панели управления во вкладке «Данные»:

В открывшемся окне необходимо выбрать режим кластеризации. У программы Key Collector есть несколько таких режимов:

  • по отдельным словам
  • по составу фраз
  • по поисковой выдаче
  • по составу фраз и поисковой выдаче

Первый вариант служит для очень тонкой настройки — он группирует те запросы, у которых совпадает хотя бы одно слово. Например, поисковые фразы «видеокамеры Минск купить» и «видеосалоны Минск» софт включил бы в одну группу.

Второй вариант учитывает строение найденных поисковых фраз и числа их совпадений (за это отвечает элемент «Сила по составу»). Отличный способ для кластеризации большого числа запросов.

Режим группировки «по поисковой выдаче» объединяет ключевики по числу совпадений ссылок в поисковой выдаче между фразами. Работает только в том случае, если в Key Collector по сайту сняты данные о поисковой выдаче («Составляющие KEI»). Здесь также есть сила группировки, отвечающая за степень связи между фразами.

Последний способ распределения запросов является комбинацией 2-го и 3-го, степень важности которых выбирается по специальному ползунку.

Проводим группировку запросов

По своему опыту скажу, что для большинства случаев подойдет именно второй вариант группировки. Его и рассмотрим подробнее. Для примера я взял тему камер видеонаблюдения. Выбрав тип группировки, указываем ее силу. Рекомендую ставить цифру 2 или 3. В моем случае мне подошло первое значение. В итоге я получил 434 группы с 1789 полезными фразами:

Если бы я взял большее число, то уже привязка была бы немного другой и число групп бы уменьшилось. А именно, стало равным 298, причем количество полезных фраз по нашему условию тоже уменьшилось — 1207.

Посмотрим, какие в итоге группы получились в первом случае с силой по составу равной 2. Для этого я экспортирую сделанную группировку в таблицу Excel. Вот отрывок экспортированной таблицы:

Как видим, в целом Key Collector смог сделать хорошее распределение найденных поисковых запросов. Но все же обточить напильником эту табличку не помешает — есть некоторые группы и отдельные слова, которые находятся не на своем месте.

Кластеризация запросов в сервисе Топвизор

Итак, запросы уже найдены (их также можно было импортировать):

Осталось заняться их группировкой. Для этого нажимаем специальный значок на панели инструментов Топвизора и выбираем нужные настройки:

Если выбор поисковика и региона (обязательно!) не сложен, то указание степени группировки может вызвать вопросы. Поясню, что это за зверь такой.

Степень группировки — это число адресов страниц, которые будут браться за проверку схожести наших запросов для одной или другой группы. Например, если этот параметр равен 3-м, то имея ряд поисковых фраз для группировки, каждая из них будет проверяться только по 3-м страницам в выдаче, а не по всему топу сразу. В принципе, этого бывает достаточно, чтобы увидеть структуру семантического ядра (группы запросов) в целом. Если же необходимо иметь более точные группы, выбираем цифру 8 или 9.

Итак, по истечении десяти минут получаем готовый результат кластеризации нашего семантического ядра:

В итоге Топвизор смог распределить 3181 найденных запросов по 514-ти группам. Причем одна группа, последняя, называется «Запросы без связей» и содержит фразы, которым не нашлось соответствия в топе:

Если данный результат нас не устраивает, мы может сразу же сделать перегруппировку — достаточно нажать на ту же кнопку в панели управления. Кстати, перегруппировка будет стоит копейки (похоже, Топвизор сразу делает группировку на большое значение, поэтому материальных и временных затрат на перераспределение просит немного):

В итоге после новой группировки мы получаем другое число групп (меньшее, чем в прошлый раз) и количество в них фраз. Они более детальны, но зато и число не попавших в эти группы запросов («Запросы без связей») заметно выросло.

Для конечной работы с кластеризованным семантическим ядром можно сделать экспортирование запросов в таблицу Excel или текстовый файл. Вот как в итоге выглядит таблица с указанием названия группы:

В целом Топвизор выполняет на отлично свою работу по распределению семантического ядра. Хороший инструмент для тех, кто не может тратить свое время на сбор запросов в программе Key Collector. Но, правда, дороговатый.

Кластеризация запросов в сервисе Serpstat

Еще один дельный вариант автоматической кластеризации есть у популярного сервиса Serpstat . Но в отличие от Топвизора, данная seo-платформа смогла разработать свою уникальную технологию группировки запросов. Делается она следующим образом.

Заходим в своем аккаунте в инструмент «Кластеризация и текстовая аналитика»:

Нажав кнопку «Создать проект», проходим по циклу шагов, указывая в соответствующих графах необходимые данные по проекту. Возьмем в качестве примера задачу группировки запросов для моего seo-блога по теме «семантическое ядро».

Сначала проходим шаг 1, указывая название проекта и адрес домена:

Затем в инструмент кластеризации Серпстата добавляем поисковые запросы. Это можно сделать как вручную, так и с помощью загружаемого списка в формате txt или csv:

И теперь остается самый ответственный шаг — выбрать схему, по которой будет происходить группировка указанных нами запросов. Для этого указываем силу связи и вариант кластеризации:

Seo-платформа Serpstat для кластеризации изучает все фразы, которые вошли в проект. И для грамотной группировки сервис по этим словосочетаниям изучает их пересечение в поисковых выдачах указанных нами поисковиков!

Более детальную схему кластеризации Серпстата можете самостоятельно изучить в этой статье блога сервиса .

Дав последние указания, Serpstat начинает группировку. После обработки всех данных, мы получаем набор запросов, фразы которых сгруппированы по своему одинаковому признаку. Вот кусочек сделанного в моем примере распределения запросов по теме «семантическое ядро» (картинка кликабельна!!!):

Ручной способ распределения семантического ядра

Ручным способом я называю такой вариант кластеризации ядра, при котором мы самостоятельно указываем группы, наводим порядок в них, формируем структуру СЯ самостоятельно. Конечно, без специальных программ здесь не обошлось. Вернее, без одной — Excel.

Распределение запросов с помощью программы Excel

Здесь все просто — выгружаем уже собранные и отредактированные поисковые запросы и ручками формируем группы и перекидываем в них подходящие фразы.

Подробно об этом варианте кластеризации я расписал в . Там я даю 3 способа группировки, выбирайте свой и дерзайте. Я лично их комбинирую в зависимости от ситуаций.

Кластеризация ключевых слов с помощью файла «Ядро»

Данный вариант отличается от предыдущего тем, что здесь уже мы перекидываем фразы благодаря умному скрипту «Ядро», сделанному в Excel. Все остальное проделывается тоже своими руками.

Скрипт «Ядро» сделали ребята из MFC (Made for content) для облегчения задачи распределения ключевиков. За основу они взяли наработку seo-специалиста Сергея Кокшарова, который и придумал вариант с Excel. Давайте посмотрим, как работает этот макрос. Для этого я воспользуюсь видеороликом ребят из MFC:

В общем, все понятно. Ничего сложного здесь нет. Поэтому, если у Вас нет возможности использовать программу Key Collector, а семантических ядер для распределения у Вас много, используйте скрипт «Ядро» (погуглите). Даже если Вы делаете кластеризацию редко для своего сайта или блога, данный макрос лишним не будет. По крайней мере с него стоит начинать, а уже потом допиливать группировку первым ручным способом.

Да, забыл самое важное сказать про файл «Ядро» — он бесплатен!

Бонус — мой способ класетризации запросов

Его я называю полуавтоматическим — роль человека здесь важна в самом начале и в конце. Его я отразил в специальной seo-шпаргалке, забирайте ее и смело используйте:

Скажу только, что в его основу легла работа с правильным поиском списка масок, использования софта Key Collector и обычная логика.

На этом мой небольшой ликбез по кластеризации поисковых фраз семантического ядра закончен. Если есть вопросы или пожелания, милости прошу в комментариум!

Где можно заказать отличное семантическое ядро?

Кстати, если Вы планируете собрать семантическое ядро для своего проекта, можете заказать семантику, обратившись . Спасибо!

С уважением, Ваш Максим Довженко

Сегодня поговорим о таком важном процессе в подготовке к созданию контента для сайта, как кластеризация семантического ядра. Это группировка ключевых запросов из ядра по группам, чтобы каждой группе соответствовала своя страница. После сбора ключевых слов для проекта, они — список без какой-либо структуры и иерархии. В списке запросы как очень похожие друг на друга, так и которые существенно отличаются по смыслу.

Кластеризация предусматривает группирование запросов, для максимальной релевантности одной странице. Кластеризацию проводят как руками, так и автоматически с помощью множества сервисов, существующих в интернете. Давайте рассмотрим все методики, которые возможно применить распределяя и группируя запросы по страницам сайта.

Содержание статьи:

Ручная кластеризация запросов ядра сайта


Несмотря, что она достаточно трудоемкая и занимает много времени, является наиболее качественным вариантом группировки. Подходить для небольших проектов, когда количество ключей не слишком большое. Если ключей несколько тысячи, то лучше провести автоматическую кластеризацию, а потом доработать результаты руками.

Делается она просто. Ключи собираются в отдельные группы по смыслу. Чтобы было понятнее, приведу пример. Есть собранные ключевые слова для информационного проекта о болезнях грудных детей. Нужно разбить все семантическое ядро на группы по отдельным болезням, чтобы написать о них и о способах лечения конкретные статьи.


Выбирая из массы ключей, собранных по запросу «Грудничок», те, которые содержат слово «тремор», мы соберем кластер ключей, где будут все запросы, относящиеся к тремору у грудничков. Именно их и нужно использовать в написании статьи о болезни.

В ручной группировке хорошо поможет обычный Excel или Google Таблицы, позволяющие сортировать, фильтровать и выделять нужные строчки и слова в них. Также есть бесплатные сервисы, облегчающие ручную группировку. Это, например, сервис Keyword Assistant, позволяющий в несколько кликов выделить нужные ключи из общего списка и поместить их в группу.

Автоматическая кластеризация запросов — онлайн сервис

Автоматическая кластеризация выполняет по определенным алгоритмам. Она делает все то же самое, что и человек. Из плюсов стоит выделить скорость работы в тысячи раз быстрее ручной, а также анализ ключевых слов и их позиций в поисковой выдаче.

Из минусов – полное отсутствие логического мышления у алгоритмов, за счет чего нередко попадаются неверные включения запросов в группы. Также явно подходящие по смыслу запросы могут не включаться в одну групп. Пример, запросы «Как одевать ребенка при низкой температуре на улице» и «Температура 39 у ребенка» — это запросы, относящиеся к разным группам, но алгоритмы чаще объединят их в одну.

Все равно после автоматической кластеризации семантическое ядро нужно дорабатывать руками, приводя его к идеальному виду. От качества группировки напрямую зависит дальнейшая оптимизация сайта.

Для автоматической работы я рекомендую сервис Rush Analytics , являющийся мощным инструментом в помощь оптимизатору. Достаточно добавить все ключевые запросы и программа сгруппирует их максимально быстро. Единственный минус – сервис достаточно дорогой и если вам нужно единоразовое использование, то лучше найти оптимизатора, имеющего подписку. За сотню-другую рублей он добавить ключи для прогона в сервисе.

Актуальны и следующие ресурсы: Seo intellect, KeyAssistant.

Особенности кластеризации семантики для коммерческих сайтов

Если с запросами для информационных проектов все понятно. Здесь у нас стоп-словами являются все коммерческие фразы со словом купить, заказать и т.д., то с коммерческими не все так однозначно. Стоит немного уделить внимание тому, как лучше сгруппировать ключи, например, для интернет-магазина.

К примеру, магазин электроники будет продавать телевизоры. Есть масса запросов со словом телевизор и нам необходимо их кластеризировать. Все запросы, которые относятся к коммерческим, типа «Купить телевизор Samsung», «Купить телевизор диагональ 43», мы распределяем по своим кластерам: по брендам, диагонали или другим свойствам.

А вот информационные запросы вроде «Как выбрать хороший телевизор» или «Какой телевизор хороший в 2017 году» мы сортируем отдельно и в структуре сайта предусматриваем блоговый раздел, где будем рассказывать пользователям о выборе или преимуществах того или иного свойства техники. Так мы сможем привлечь больше трафика за счет и информационных запросов.

Как видите, кластеризация семантического ядра – это несложно, просто занимает достаточно много времени. Но является одним из столпов в подготовке к запуску проекта.

  • Читайте статьи по этой теме:

Привет, дорогие друзья! С наступившим Новым Годом вас, надеюсь, вы уже отошли от праздников и настроились на боевой лад. У меня для вас новогодний подарок сегодня — очень крутой практический пост. Пост не мой, но более чем достоин появиться на страницах этого блога.

Обзор составлен крутым чуваком по имени Дмитрий Мирошниченко. Дима живет в Волгограде, работает руководителем проектов в местной веб-студии, которая занимается развитием и продвижением собственных проектов. А еще Дима — кандидат наук, а это вам не хухры-мухры!

Всё что написано ниже является моей точкой зрения и основано на моём жизненном опыте. Я не претендую на истину в последней инстанции. Если вы видите какие-то процессы иначе и знаете, как можно решить поставленную задачу эффективнее, крайне желательно не сдерживать себя и написать об этом в комментарии.

Итак, задача: составить семантическое ядро для сайта. Что означает слово «семантическое»? Вот что нам сообщает Википедия. Сема́нтика (от др. -греч. σημαντικός - обозначающий) - раздел лингвистики (в частности, семиотики), изучающий смысловое значение единиц языка. То есть нам нужно выделить смысловые направления для структуры сайта.

Как обычно решается эта задача?

  1. Парсим запросы (вордстат , различные базы, подсказки, сервисы типа спайвордс и семраш , открытые счётчики статистики и другие источники)
  2. Отсеиваем мусор и проверяем частотность
  3. Распределяем запросы на группы
  4. На основе групп делаем структуру сайта и распределяем статьи

Первые два пункта успешно решаем с помощью кейколлектора . Тут особых мук выбора не возникает. Кейколлектор действительно удобный инструмент.

Третья задача самая интересная. Её решение мы и будем рассматривать.

Четвёртая задача решается достаточно тривиально, если третья была качественно реализована.

Исходные данные

Информационный сайт дачной тематики. Раздел «кустарники и деревья». Всего было собрано 562 ключа. Это тренировочный набор данных. Мне было важно сравнить результаты работы разных инструментов.

Для раздела информационного сайта были собраны запросы, убран мусор и расставлена частотность «!» по вордстату больше 30. Нужно их распределить по группам.

Распределять запросы можно вручную и автоматом. Вручную распределяем по смыслу. Тут всё понятно. Для автоматической кластеризации есть много способов. Более подробно рассмотрим для каждого инструмента.

Инструменты, облегчающие ручную кластеризацию запросов

Excel, LibreOffice, OpenOffice

Думаю, тут нет смысла подробно описывать, как работать с этими инструментами.

Достоинства

  • высокая точность обработки — руками всё-таки обрабатываем
  • универсальность — можно учитывать кучу параметров
  • в случае с LibreOffice, OpenOffice — бесплатные

Недостатки

  • в случае с Excel — платный
  • низкая скорость работы — при работе с большими объёмами данных
  • нужно делать бекапы

Google документы

Достоинства

  • аналогично предыдущему пункту
  • онлайн сервис — удобный доступ к документу
  • не нужно делать бекапы
  • бесплатный

Недостатки

  • скорость работы всё также низкая

kg.ppc-panel.ru

Онлайн сервис. Загружаешь запросы, фильтруешь, выделяешь группы.

Работает быстро. Функционал достаточный (кроме сохранения проектов), хороший интерфейс.

Достоинства

  • удобный интерфейс
  • быстро работает
  • наглядность
  • не нужно регистрироваться
  • бесплатный
  • онлайн сервис

Недостатки

  • нельзя сохранять проекты можно, только выгружать уже готовые
  • вытекает из предыдущего — если сервис заглючит, то потеряются все наработки
  • нельзя загружать частотности

Keyword Assistant — cоздание структуры будущего сайта

Ещё один онлайн сервис. Аналогичен предыдущему. Уже можно сохранять проекты.

Достоинства

  • проекты сохраняются
  • хороший и понятный интерфейс
  • можно загружать частотности
  • бесплатный
  • онлайн сервис

Недостатки

  • скорость работы повыше, чем при работе с excel, но всё равно сопоставимая
  • для параноиков — непонятно где хранятся ваши данные

Инструменты для автоматической кластеризации запросов

Группировщик ключевых слов для PPC

Десктопная версия со странной логикой поведения. Подробности по ссылке выше (где скачать, можно найти там же).

Краткое описание работы алгоритма кластеризации:

У нас есть некий набор ключевых слов. Перед составлением индекса, скрипт нормализует все словоформы. На следующем этапе скрипт группировки определяет частоты для всего индекса документа и выстраивает рейтинг. Частоты считаются для каждого слова (после нормализации). Если у нас есть «отдых в тунисе» то скрипт считает частоты для «отдых» и «тунис».

На данном этапе – рейтинг слов выстраивается от наиболее частотных к менее частотным. Зачем это нужно? Чтобы создать основные группы. Скажем так, если слово «египет» встречается чаще чем слово «отель» то поисковый запрос (например, [недорогие отели египта]) включающий слово «отель» будет отнесен к группе «египет» а не наоборот.

Итак, мы сгруппировали слова, но довольно примитивно. Далее – нам нужна более точная группировка.

Более точная группировка означает, что внутри каждой группы скрипт создаст подгруппы и распределит слова между ними.
На данном этапе точно также будет выстраиваться рейтинг слов по частоте. При этом рейтинг будет создаваться только внутри группы, основное слово группы (оно же – название группы) не будет принимать участие в рейтинге. Кроме того, рейтинг слов в группе выстраивается по обратной частотности. Т.е. слово с наименьшей частотностью – первым создаст «свою» подгруппу.

Конечно, создать свои подгруппы могут только те слова, которые встречаются не менее N-раз (задается в настройках скрипта, но обычно это не менее 4-5).

Именно такой подход работает очень эффективно, когда основные группы создаются на основе рейтинга от наиболее частотных слов к наименее частотным, а подгруппы – от наименее частотных к наиболее частотным.

На выходе получаем сгруппированный список.

Достоинства

  • пока бесплатный
  • быстро работает

Недостатки

  • десктопная версия
  • как-то криво сохраняется проект
  • как там удалить что-нибудь?
  • крайне странная логика поведения, откуда в системе слова которых там не было? (видно на скрине)
  • алгоритм не учитывает смысла слов, только общий корень — самый существенный недостаток
  • заявлено огранивение в 1000 ключей
  • нельзя загрузить частотность
  • нужно делать бекапы

Rush Analytics

Онлайн сервис кластеризации запросов на основе выдачи ПС. Точнее кластеризация это только одна из возможностей сервиса. Более подробное описание доступно на сайте.

Кратко об алгоритме работы:

Кластеризация – это автоматическая разбивка ключевых слов на группы.
Как работает технология?
Вы загружаете список ключевых слов, выбираете тип кластеризации – система анализирует ранжирование поисковых систем и с помощью нашего алгоритма разбивает ключевые слова на группы, которые будут отлично ранжироваться в поисковых системах. На выходе Вы получаете ключевые слова разбитые на группы.

Можно выставить силу группировки. Выставляется видимо в попугаях. На выходе excel файлики с выбранной силой группировки. На первой вкладке кластеры. На второй всё, что осталось без кластеров.

Плата снимается только для сгруппированных запросов (максимальное количество).

Напомню, всего 562 запроса. Сколько запросов сгруппировалось для каждого варианта видно в таблице ниже.

Получаем максимальное число сгруппированных запросов 359. Неплохо для автомата. Сколько это стоило?

Получаем, что кластеризация 359 запросов обошлась в 552,5 рубля или чуть больше 1,5 рублей за зарос (хотя цифра группировки за запрос мне совершенно не интересна, но для общей картины пусть будет). Тут нужно уточнить, что кластером считается более двух запросов. Сколько групп получилось так и не придумал, как посчитать.

Теперь посмотрим что там по качеству.

Выберем тестовую группу по черешне. Вот список исходных запросов:

как правильно обрезать черешню валерий чкалов черешня черешня бычье сердце черешня дерево черешневый сад черешня ипуть обрезка молодой черешни обрезка черешни черешня сорта сорта черешни

Получилось два кластера для силы группировки 4 и 5:

Для силы группировки 3, кластер обрезки немного расширен:

Очевидно, что результат так себе.

Если бы я делал вручную, то кластер по сортам выглядел бы примерно так:

черешня бычье сердце черешня ипуть валерий чкалов черешня черешня сорта сорта черешни

Так что алгоритмы явно нужно допиливать.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • при регистрации выдают 3000 рублей на счёт (на момент публикации, по моему уже прикрыли такую халяву)
  • худо бедно, но учитывается смысл (а не только общий корень) на основе выдачи поисковиков

Недостатки

  • пока в стадии тестирования (на момент публикации уже вроде нет)
  • платный
  • дорого — хорошо если ядро 500 запросов, а если тысячи и сотни тысяч?
  • всё равно нужно доделывать руками, полного автомата не получается

SEMparser — Структуризация семантики для SEO и контекста

Ещё один онлайн кластеризатор на основе выдачи поисковика.

Как работает (взято с сайта):

Как выглядит внутри:

После автоматической кластеризации появляется окно редактирования, где можно подправить ошибки.

Скачивается excel файлик. На первой вкладке запросы и группы с подробностями.

На второй вкладке только группы.

На третьей вкладке какой-то топ тематики.

Так же можно установить силу группировки. Потестил теже цифры: 3, 4 и 5.

Тут нужно уточнить, что кластер из одного запроса это тоже кластер. И он учитывается. Так что формально получается, что сгруппировалось 100% запросов. А вот сколько получилось групп с запросами 2 и более я тоже не придумал как посчитать.

Так же нужно учитывать, что ценообразование немного другое. Деньги снимаются за все запросы, которые есть в документе. Я купил 600 запросов, что обошлось мне в 288 рублей. Получаем стоимость одного запроса 0,48 копеек. После группировки у меня в системе осталось 38 запросов. В итоге группировка тестовой выборки ключей обошлась в примерно в 270 рублей. Что в два раза ниже, чем в предыдущем сервисе.

Посмотрим, что тут с качеством.

Для всех сил группировки получилось — 4 группы:

валерий чкалов черешня (1/170) валерий чкалов черешня (170) черешня ипуть (5/472) черешня ипуть (159) сорта черешни (134) черешня сорта (92) черешня дерево (44) черешневый сад (43) черешня бычье сердце (1/64) черешня бычье сердце (64) обрезка черешни (3/352) обрезка черешни (226) как правильно обрезать черешню (86) обрезка молодой черешни (40)

Тоже видим, что по смыслу не идеально. Нужно дорабатывать руками.

Достоинства

  • онлайн сервис
  • все проекты сохраняются
  • 50 запросов для теста при регистрации
  • худо бедно учитывает смысл
  • дешевле, чем предыдущий вариант

Недостатки

  • платный
  • алгоритм работает не идеально, нужна ручная коррекция

Just Magic — автоматический подбор семантики для SEO и контекстной рекламы

Интересный сервис на мой взгляд. Дизайн сайта: привет консоль.

Что у них заявлено на сайте:

— Собирать семантику для существующих страниц сайта, сразу правильно привязывая запросы к ним.
— Расширять существующую структуру сайта.
— Предлагать тематическую семантику для новых страниц сайта на основании текущего СЯ.
— Создавать семантику для проектируемого сайта.
— И просто кластеризовать запросы. Включая тематическое разбиение.

Можно посмотреть доклад разработчика на ТопЭксперте:

Вот что мне ответили разработчики про то, как там всё устроено:

Мы решаем сугубо утилитарную задачу — определить какие запросы могут продвигаться на одной странице.

Отсюда и метод решения — мы собираем выдачу ПС по каждому запросу и кластеризацию проводим на ее основании.

Фактически, нам необходимо решить достаточно простую задачу — раскидать запросы по совпадению URL в выдаче, попутно позаботившись, чтобы в один кластер не попали принципиально разные типы запросов. Типы мы выделяем такие:
— Коммерческий/информационный.
— «На морду»/"на внутряк".
— Однословный/2+ словный.
— С маркерами типа контента/без них.

«Маркеры типа контента» — это слова запроса, которые ПС использует для выставления требований к контенту на продвигаемой странице. Например — («отзывы», «видео», «скачать», «фото»).

Поскольку задача определена и набор входных данных довольно прост, то и алгоритм не замысловат. В основном алгоритме системы машинное обучение не используется. Центроиды в текущем алгоритме мы де-факто используем (один из запросов является «центром» кластера, а остальные должны иметь определенную меру схожести с ним). Сейчас используется «жадный» алгоритм их (центров) выделения. Но в этом методе есть определенные недостатки, поэтому в следующей версии алгоритма, которая сейчас внедряется, мы в принципе откажемся от понятия запроса-центра кластера.

Машинное обучение мы тоже используем, но в другом месте — автоматическая генерация запросов-маркеров на основании данных Яндекс.Метрики.

Пока попробовать не удалось. Отправил запрос на тестовый доступ. Сказали у них обновление. Основной функционал стоимостью от 30 000 руб/месяц будет доступен в конце января. Для простых смертных с объёмами поменьше в феврале.

Если всё будет работать, как заявляют, то будет очень круто. Посмотрим.

Достоинства

  • хорошие перспективы
  • онлайн сервис

Недостатки

  • пока нет версии для простых смертных, только месячная подписка
  • попробовать так и не удалось
  • как есть — дорого

SEO intellect — Сервис автоматизации SEO работ

Ещё один онлайн сервис по кластеризации. Заявленный функционал:

Сервис автоматизации SEO работ
● кластеризация запросов
● подбор посадочных страниц
● поиск конкурентов
● помощь в оптимизации контента
● заказ оптимизированных текстов

Мне так и не удалось его заставить работать. Нет никакой справки, никаких подсказок...

Достоинства

  • онлайн

Недостатки

  • так и понял как с ним работать
  • платный

Coolakov.ru — Разбивка ключевых запросов

Описание на сайте:

Сервис позволяет автоматически группировать уже собранные запросы. Разбивка запросов на группы производится на основе схожести топ10 Яндекса.

Про особенности алгоритма ничего найти не удалось.

Для моих 562 запросов получилось 305 групп. В группе минимум один запрос. Посмотрим что там с нашей черешней:

Видно, что группы 73 и 189 можно было бы и объединить… Ну и в остальном тоже понятно. Кластеризация, мягко говоря, не идеальная.

Достоинства

  • онлайн сервис
  • бесплатный

Недостатки

  • Как это скачать? Нет никаких кнопок, чтобы скачать. Можно только скопировать текст.
  • Без регистрации можно работать только с 20-00 до 7-00 по Москве. Зарегистрироваться никак нельзя. Вообще.

s:toolz — профессиональный инструмент кластеризации запросов на основе поисковой выдачи

Очередной сервис кластеризации. Особенность в том, что работает не в автоматическом режиме. Это же его и недостаток.

Порядок работы

Заявленный функционал:

Сервис кластеризации запросов предназначен для быстрой автоматизированной группировки больших списков запросов (ключевых слов для продвижения) в кластеры, которые формируются исходя из выдачи поисковых систем и представлений поисковой системы Яндекс о потребности пользователя.

Запросы из одного кластера необходимо продвигать на 1 страницу.

Отправил бриф. Ответили через два дня. Оказывается, у них заявки в ручном режиме обрабатываются. Пишут, что так больше получают обратной связи. В будущем грозятся сделать всё в автомате.

Сама кластеризация, пишут, длилась меньше минуты. Цитата:

На просчет вашей заявки ушло меньше минуты. Самое большое, что приходилось на данный момент обрабатывать — 55к, расчет шел около 3 часов.

Что пишут про алгоритм работы:

Алгоритм группировки разработан свой. Данные — топ 10 яндекса по каждому запросу. Машинное обучение используем, но для другого функционала, который скоро будет представлен.
Есть проблемы с релевантными страницами в отчете. В индекс поисковика не всегда попадает то, что нужно, особенно, если над проектом еще не работал специалист.
В результате приходится дополнительно обрабатывать результат руками, при определенном кол-ве запросов это уже грустно. Задача в процессе решения.

Кластеризация моих 562 запросов обошлась мне в 309 рублей. Имеем 60 копеек за запрос. Скидок не давали. Да я и не просил.

Теперь посмотрим что там с качеством:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни сорта черешни черешнЯ сорта черешнЯ дерево валерий чкалов черешнЯ черешнЯ бычье сердце черешневый сад черешнЯ ипуть

Снова сорта остались без кластеров.

Достоинства

  • коммуникабельность тех поддержки, ответили на все вопросы
  • онлайн сервис

Недостатки

  • работает не в автоматическом режиме, человеческий фактор портит впечатление
  • платный
  • нужна ручная коррекция кластеров

Mc-Castle.ru — Кластеризатор СЯ

И ещё один сервис. Кластеризует тоже, видимо, по словоформе. Никаких поисковиков.

Результат работы:

Что с этим дальше делать я понять не смог. Как мне разбить по кластерам? Как посмотреть какие запросы попали в один кластер? Ну и если разбивка идёт на основе словоформ, то ни о каком объединении по смыслу речи не идёт.

Достоинства

  • онлайн сервис
  • бесплатный
  • не нужно регистрироваться

Недостатки

  • странный интерфейс
  • алгоритм разбивки на основе словоформ

Key Collector

Почти всем известная программа, кто так или иначе сталкивался со сбором ключей.

Группировка это только маленькая часть того, что она умеет.

Запросы можно сгруппировать по составу фраз, по выдаче поисковиков и в комбинированном режиме. Группировка на основе поиска работает кода собраны данные для KEI. На сбор информации для группировки ушло несколько минут. Сама группировка длилась меньше минуты.

Лучшей группировки удалось добиться со следующими параметрами:

В первом случае сгруппировалось 381 фраза или 68% от общего числа. Во втором случае 403 или 72%, что очень хорошо.

Интересующие нас черешни по сортам (ипуть, бычье сердце...) тоже и не попали к сортам. Были выделены в отдельные группы. Что, в общем, и не удивительно.

Остальные запросы сгруппировалась более или менее. В итоге имеем 72% экономии времени (остальное доделывать руками).

Достоинства

  • понятный интерфейс
  • можно подбирать настройки группировки
  • куча других возможностей по работе с ключами
  • демократичная цена
  • отличная тех поддержка

Недостатки

  • десктопная версия
  • нельзя редактировать получившиеся группы в программе — только в excel
  • для работы нужны антигейт, прокси, аккаунты — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • нужна ручная коррекция кластеров

МегаЛемма — автоматизация составления семантического ядра и кампаний Яндекс.Директ

Десктопная программы для кластеризации.

Сложно просто взять и работать. Юзабилити хромает.

Жму нормализовать. Он мне выдаёт сообщение, что нужно сохранить проект. А автоматически нельзя сохранить проект? Зачем мне нажимать на кнопку, если это может сделать компьютер?

Не очевидно, что нажать, чтобы запустить процесс разбивки на группы. Оказывается это «частотный анализ».

Парсинг 562 запросов на стандартных настройках в 7 потоков и на 7 прокси занял примерно 10 минут. Ещё минут 5 заняла нормализация.

После нормализации снова непонятно как группировать нужные мне слова. Информацию нашёл на 27 странице руководства. И на том спасибо.

Ведь это же основной функционал программы. Разбивать слова на группы. Почему самая нужная информация находится так далеко? Ну и полезно было бы сделать что-то вроде quick start. Для контекста и для сайтов раздельно. Я понял, там есть различия в работе.

Доводить дело до конца по кластеризции своих запросов тут не захотелось. Основная проблема в расстановке акцентов в интерфейсе программы.

Чисто для кластеризации использовать смысла нет. Думаю, вся мощь программы должна проявиться при полной работе с ключами. Начиная с очистки запросов от мусора и создания стоп слов.

Достоинства

  • есть полноценная демоверсия

Недостатки

  • десктопная программа
  • для работы нужны антигейт и прокси — с онлайн сервисами таких заморочек нет, они берут эти проблемы на себя
  • объединяет на основе словоформ, то есть ни о каких смыслах говорить не приходится
  • юзабилити нужно дорабатывать

«Семён-Ядрён» — формирование семантического ядра сайта на основе поисковых систем

Ещё один удалённый сервис. В последнее время много пиарится.

Опять же с сервисом нужно работать через посредников. То есть через людей. Никакой тебе автоматики.

Нужно сначала подать бриф, потом подождать пока с тобой свяжутся. Согласовываешь детали. Затем оплата.

За бесплатно делать группировку не захотели, но сделали скидку в 50%. В итоге группировка 562 запросов мне обошлась в 350 рублей (без скидки просили 700). Сгруппировать один запрос вышло 60 копеек (или 1,2 рубля без скидок)

Опять же проблемы с юзабилити на сайте. Кнопка «подать бриф» маленкая, белая и незаметная на белом же фоне. Не удержался, простите.

Как и на основе чего делают кластеризацию, говорить отказались. Известно, только, что на основе выдачи ПС.

Результат работы прислали через несколько часов. Помимо самих кластеров прислали ещё 100500 параметров и файлов. Хотя я не просил. В принципе полезная информация для анализа. Но логично было бы разделить: хочешь просто кластеризацию — одна цена, хочешь ещё ништяков — другая. Так как разным клиентам нужна разная информация.

Посмотрим, какие кластеры получились:

обрезка черешни как правильно обрезать черешню обрезка молодой черешни черешня ипуть сорта черешни черешня сорта черешня бычье сердце валерий чкалов черешня черешня дерево черешневый сад

Это уже гораздо лучше! Отдельные сорта попали-таки в кластер по сортам! Правда, Валерий Чкалов потерялся.

Достоинства

  • быстро ответили
  • готовы делать скидки
  • онлайн сервис
  • куча различной доп информации, вплоть до заданий копирайтерам (правда пишут, что задания всё же нужно допиливать индивидуально)

Недостатки

  • есть посредник в виде человека
  • по алгоритмам сплошная коммерческая тайна
  • нужна ручная коррекция кластеров

Итоги

Сводную таблицу по функционалу и стоимости можно посмотреть ниже.

Инструмент Стоимость Алгоритм кластеризации Формат Время работы Стоимость группировки всех запросов Стоимость группировки одного запроса
бесплатно на основе выдачи ПС онлайн несколько минут бесплатно бесплатно
платный на основе выдачи ПС онлайн меньше минуты + два дня 309 р. 60 коп.
платный на основе словоформ онлайн меньше минуты бесплатно бесплатно
1 700 р. на основе словоформ + на основе выдачи ПС десктоп несколько минут
3 000 р. на основе словоформ и лемм десктоп несколько минут
платный на основе выдачи ПС онлайн несколько минут + пару часов 350 р.
(700 р. без скидки)
60 коп.
(1,2 р. без скидки)
Ниже представлены сервисы, не вошедшие в основной обзор в рамках данного поста, но были предложены пользователями в комментариях или представителями сервисов.
Topvisor.ru платный на основе выдачи ПС онлайн ~7-8 мин. на 3000 запросов от 30 коп.

В итоге пока не имеем инструмента, который на полном автомате сгруппирует нужные запросы без ошибок.

Наилучшие результаты показали (судил по сортам черешни) Semparser.ru и Seo-case.com. По стоимости получаем 48 копеек против 1,2 рубля соответственно. Разница почти в три раза. Дополнительная стоимость у Seo-case, я так думаю, за счёт бонусной информации. На следующем месте стоит Кей-Коллектор (так как он почти наверняка есть у человека, который занимается запросами).

Самый основательный подход по кластеризации, на мой взгляд, у ребят из Just-magic.org. Так что как только появится возможность, обязательно потестирую.

Как бы то ни было, работа руками лучше, чем любым сервисом и с этим сложно поспорить. Немного дороже, но намного качественнее.

На этом мега обзор заканчивается, дорогие друзья! Я уверен, вам понравилось, поэтому прошу вас оставить свое мнение в комментариях, а если вам есть, что добавить, то тем более отписывайтесь.

До связи друзья!

Последние материалы раздела:

Визуальные эффекты Launchpad в OS X Lion Что такое launchpad в mac
Визуальные эффекты Launchpad в OS X Lion Что такое launchpad в mac

Launchpad – весьма удобная функция в macOS, позволяющая отобразить приложения в виде набора иконок, похожего на рабочий стол iOS. Проблема...

Игра «Пекло!» – официальная группа. Вирус CRYPTED000007 — как расшифровать файлы и удалить вымогателя Резюме, отзыв, мнение
Игра «Пекло!» – официальная группа. Вирус CRYPTED000007 — как расшифровать файлы и удалить вымогателя Резюме, отзыв, мнение

Рад представить вам очередную игрулю для убивания времени с вконтакта. Игра подкупает с первых секунд качественной графикой и анимацией, а также...

Файловая система RAW и как вернуть NTFS, FAT32 Система не видит файловую систему жесткого диска
Файловая система RAW и как вернуть NTFS, FAT32 Система не видит файловую систему жесткого диска

Современные накопители на основе флеш-памяти имеют большие объёмы и высокую скорость чтения-записи, благодаря новому протоколу передачи данных USB...