Как работает «Умный поиск»

Содержание

Промахнуться мимо клавиши — как два пальца, извините, об асфальт. Может, у клиентов большие руки или зрение –11. А если температура под 40, понос, головная боль и всего трясет на 9 баллов по шкале Рихтера? Можно не то что промазать по клавише, а вообще забыть родной русский язык.

Если в таком состоянии начать что-то искать на сайте, есть риск ничего не найти. Владельцы интернет-магазинов так теряют кучу денег ежедневно. А другие зарабатывают — они запускают умный поиск для сайта. Разбираемся, что это такое.

Что такое умный поиск

«Умный поиск» — это технология. Как обычный поиск на сайте, только мощный и умный. Спасибо, Кэп. Умный поиск понимает слова с опечатками или в другой раскладке, распознает смысл языка и синонимы, и даже может поиграть с вами в «Далеко-далёко». Он воспринимает даже криворукий ввод запроса и помогает владельцам сайта не терять деньги.

Представим, что у нас маркетплейс аптек. Человек приходит к нам, чтобы дрожащими от озноба руками ввести название препарата и найти аптеку, где его можно купить. Пусть это будет парацетамол. У человека температура — он пишет с ошибками. Или он просто неграмотный, не суть. Посмотрим, какие результаты.

Обычный поиск. Ввели в поиске слово с ошибкой и увидели… ни-че-го. Владельцы сайта теряют деньги. Пусть даже от неграмотных клиентов, которые не знают, как пишутся названия лекарств.

Сколько денег мы потеряем? Неизвестно, может быть просто 25 рублей — сколько там стоит парацетамол. Ну ладно парацетамол. А если мы захотим купить адамантилбромфениламин? А если нам нужен аминодигидрофталазиндион натрия? Вряд ли аптечный сайт с обычным поиском нам чем-то поможет. Короче: чтобы не терять деньги, магазину со сложной товарной номенклатурой нужен умный поиск.

Вот как изменится ситуация.

Умный поиск понимает, что от него хочет человек. Даже если клиент пишет название с ошибкой. Благодаря технологии сайт не теряет деньги, а люди находят то, что ищут без особых заморочек и бродилок по навигации сайта.

Умный поиск распознает ошибки в словах и подсказывает пользователям запросы. Это похоже на игру в «Далеко-далёко» (в 90-х игры были не только на компьютере).

Ты ему:

— Спи!

А он тебе:

— … перон?

— ...рамид?

— … роксатрин?

С такой штукой вы не потеряете ни одного клиента, если он решил воспользоваться поиском.

Что должен уметь умный поиск

Хорошая технология:

  • принимает слова с опечатками: «красовки», «халадельник» и «тумбачка»
  • понимает словоформы: «анальгинА», «футболкУ», «смартфонОМ»
  • ищет запросы в неправильной раскладке: «rehcnrf», «vbythfkmyfz djlf»
  • понимает транслитерацию: «Самсунг», «Хуавей», «ОкоЦРМ»
  • ищет по синонимам: «мобильник», «плазма», «телек»
  • дает подсказки по первым буквам

Как работает умный поиск

Тут все очень сложно. Показываем на примере Сфинкса — одного из самых известных поисковых движков. Считается довольно умным, далеко не все умеют так, как он.

1. Сначала алгоритм дробит все названия в каталоге по пробелам.

БылоСтало
Парацетамол сироп 200 мг №5 (Фармакон)парацетамол
сироп
200
мг
№5
(Фармакон
2. Потом робот начинает показывать интеллект и выделять триграммы — делить все названия на тройки последовательно идущих знаков.

БылоСтало
парацетамол' __п, _па, пар, ара, рац, аце, цет, ета, там, амо, мол, ол_, л__'

3. Затем каждая из триграмм индексируется и получает свой идентификатор. Этот идентификатор занимает свое место в каждом названии, где встречается.

БылоСтало
парID1023

4. Когда клиент вводит на сайте название какого-нибудь товара, система тоже строит для этого запроса триграммы. Допустим, человек пишет с ошибкой «порацетамол». Система разбивает этот запрос.

ЗапросТриграммы
порацетамолп, _по, пор, ара, рац, аце, цет, ета, там, амо, мол, ол_, л__

5. Потом система сопоставляет подставленные триграммы с ранее сформированной базой. И находит те позиции в каталоге, где встречается больше всего совпадений. Она сканирует всю базу, находит лучшее исправление и передает его CMS, которая управляет сайтом. А та уже достает и показывает реальные карточки товаров.

Подсказки работают по той же схеме, только без нажатия кнопки «Найти» — движок делает поиск фоном.

Повторимся: у всех поисковых движков сложная архитектура и алгоритмы. А некоторые просто выдают себя за таковых. Так что вполне возможно, другие сервисы будут работать иначе.

Как сделать умный поиск для сайта

Есть четыре способа:

1. Разработать собственный поисковый алгоритм. Движок — адово сложная вещь. Если разработчик полезет в код, то может сломаться — или код, или разработчик. Поэтому никто из предпринимателей средней руки свои алгоритмы для поиска не разрабатывает. Совсем. Кроме тех, кто один раз попробовал и затянуло. Обычно используют те, что есть. А есть еще три способа.

2. Использовать сторонний поисковый движок. Есть несколько бесплатных общедоступный движков, вроде Elasticsearch и Sphinx. У них открытый исходный код и понятные API. Можете погуглить-посмотреть-почитать отзывы. Минус этого инструмента — нужно устанавливать его на свой сервер и занимать место, а потом долго настраивать. И движок, и админку. Короче, все равно нужны айтишники.

3. Использовать сервисы поиска. Обычно они работают на поисковых движках, но являются облачными — не нужно устанавливать на свой сервер. А еще не нужно сильно заморачиваться с интеграцией — помогут, подскажут, настроят. Но за деньги. Сервисы монетизируют бесплатные движки.

4. Использовать стандартный поисковый сервис CMS. Только он не будет сильно умным. Например, поисковик Вордпресса не умеет распознавать ошибки и опечатки. То же самое у Битрикса — потому что штатные поисковики не строят триаграммы. Их предел — распознание окончания слов, да при включенной морфологии.

Короче: реально рассматривать только два способа: движки и сервисы. Посмотрим, какие есть варианты.

Google Programmable Search Engine

Стоимость: $5/1000 запросов, есть бесплатная версия с рекламой на сайте

Реализация: JavaScript на стороне клиента/JSON API на стороне клиента или на стороне сервера

Для чего: простые сайты, блоги, справочники, информационные страницы

Самостоятельная настройка: да

Программируемая поисковая система — это как поисковая строка Гугла у вас на сайте. Вы можете настраивать внешний вид окна поиска и страницы результатов так, чтобы он соответствовал стилю вашего сайта. А еще можете уточнять результаты поиска, использовать автозаполнение, продвигать результаты и смотреть аналитику прямо в сервисе.

В чем плюс: можно бесплатно или за небольшие деньги получить у себя на сайте поисковик от Гугла.

В чем минус: поисковик будет делать поиск не только по вашему сайту, а в целом по интернету. Действительно, результаты с вашего сайта будут иметь более высокий приоритет. Но где гарантия, что после получения выдачи человек не уйдет к конкурентам?

Элемент поисковой выдачи с рекламным блоком. Пользователь может запутаться и подумать, что уже ушел с сайта.

Яндекс Поиск

Стоимость: бесплатно

Реализация: HTML-код для вставки на сайт

Для чего: информационные порталы, интернет-магазины

Самостоятельная настройка: да

Яндекс.Поиск для сайта позволяет легко организовать поиск по вашим сайтам, используя механизмы индексации и ранжирования, реализованные Яндексом. По факту, это филиале Яндекса на вашем сайте. Умеет то же самое, что и сам поисковик: исправляет неправильную раскладку и опечатки, находит ошибки и распознает варианты написания, синонимы и пр.Все настройки в личном кабинете. Можно настраивать поисковые подсказки, работать с уточнениями, менять внешний вид сниппетов и всей поисковой строки.

Кроме обычного поиска, есть поиск для интернет-магазинов. Ищет позиции по каталогу товаров, загруженному в форме YML-документа. Поисковая выдача оптимизирована для отображения информации о товарах. Можно искать товары по названию и описанию, в наличии или под заказ, фильтровать результаты и получать в результатах поиска основные характеристики.

В чем плюс: полностью бесплатный.

В чем минус: работает только по проиндексированным Яндексом страницам.

В личном кабинете можно настроить внешний вид поисковой строки вплоть до цвета рамки поля для ввода запроса. К — кастомизация.

Solr

Стоимость: бесплатно

Реализация: установка на сервер и подключение через API

Для чего: универсальный

Самостоятельная настройка: нет, нужен программист, а лучше команда

Solr — это автономный быстрый поисковый сервер с открытым исходным кодом и REST-подобным API, построен на Apache Lucene. Отличается высокой надежностью, масштабируемостью и отказоустойчивостью. Обеспечивает распределенное индексирование, репликацию и запросы с балансировкой нагрузки, автоматическое переключение при отказе и восстановление, централизованную настройку и многое другое.

Умеет все то, что должен уметь умный поиск. Но запустить его на своем сайте самому не получится. Каталоги для индексирования размещаются через JSON, XML, CSV или двоичный код через HTTP. Отправка запросов — через HTTP GET.

В чем плюс: полностью бесплатный и слишком умный, чтобы быть поиском

В чем минус: полноценный движок — для интеграции нужен специалист.

Панель инструментов в пользовательском интерфейсе Solr. Русскоязычного интерфейса нет. Просто так не разберешься.

Sphinx

Стоимость: бесплатно

Реализация: установка на сервер и подключение через API

Для чего: универсальный, для сайтов с большим трафиком

Самостоятельная настройка: нет, нужен программист, а лучше команда

Полноценный движок с открытым исходным кодом. Один из самых популярных в мире. Его особенность — высокая скорость индексации и поиска, а также интеграция с существующими СУБД (MySQL, PostgreSQL) и API для распространённых языков веб-программирования. Официально поддерживаются PHP, Python, Java. Высокая скорость поиска и масштабирования, поддержка стоп-слов и морфологического поиска (встроенный модуль русского языка). Выдерживает высокие нагрузки.

В чем плюс: полностью бесплатный и очень быстрый.

В чем минус: для интеграции нужен специалист или команда.

Интерфейс Сфинкса в реальном времени показывает степень загрузки серверов. Если будут угрозы для производительности, система предупредит владельца.

Elasticsearch

Стоимость: бесплатно

Реализация: установка на сервер и подключение через API

Для чего: универсальный, для сайтов с большим трафиком, если нужны метрики и аналитика.

Самостоятельная настройка: нет, нужен программист, а лучше команда

Наиболее популярная тиражируемая свободная программная поисковая система. Elasticsearch позволяет выполнять и комбинировать многие типы поиска: структурированный, неструктурированный, географический, метрический — любым удобным способом. В Elasticsearch более сложная и богатая система условий в поисковых запросах. У программы много наворотов, вроде визуализации данных, машинного обучения поиска и индексации каталога без схемы. Из-за этого поисковая машина очень требовательна и кушает много памяти, очень много памяти.

В чем плюс: полностью бесплатный, много наворотов, подойдет, если нужны метрики, аналитика и работа с неструктурированными базами.

В чем минус: для интеграции нужен специалист или команда. Требовательный к ресурсам.

С помощью клиента Kibana Elasticsearch создает информационные панели, которые позволяют пользователям визуализировать данные и поисковую аналитику. Выглядит неплохо.

Searchanise

Стоимость: от $9/месяц. Цена зависит от количества товаров.

Реализация: установка на сайт в качестве плагина

Для чего: для онлайн-магазинов

Самостоятельная настройка: да, есть гайды

Это облачный умный поиск для интернет-магазинов, который работает на движке Sphinx. Получаете тот же функционал, только не нужно ничего устанавливать на сервер. Просто добавляете на сайт плагин, и все работает.

В чем плюс: работает в облаке — не будете нагружать сервер. А еще сможете интегрировать самостоятельно или с минимальным вмешательством специалистов.

В чем минус: стоимость — чем больше товаров, тем дороже. Другой минус — подойдет не для всех CMS.

Пример поисковой выдачи Searchanise. Начинаешь вводить запрос и система сразу показывает подсказки и товары. Удобно.

Оптимизация внутреннего поиска

Мало просто прикрутить на сайт поисковую строку. Чтобы поиск помогал зарабатывать, а конверсия росла, нужно работать с аналитикой и заниматься оптимизацией внутреннего поиска. Вот что мы имеем ввиду.

Работа с аналитикой

Почти все сервисы (облачные — уж точно) предлагают в пользовательских кабинетах посмотреть статистику внутреннего поиска. Сможете узнать:

  • что люди ищут чаще
  • на какие товары в поиске больше кликают
  • какой показатель отказов после перехода из поиска
  • корректно ли работает поиск
  • находят ли люди то, что ищут и т. д.

Аналитика покажет эффективность поиска и покажет точки для роста. Сможете улучшить работу поиска — он покажет больше конверсий. А если встроенной аналитики нет, всегда можно настроить отслеживание поиска в Гугл Аналитике.

Пример отслеживания поиска в Гугл Аналитике. Видим, что поисковым сервисом пользовались 0,18% посетителей. Это мало, зато каждый 4 из них переходил на другую страницу сайта.

Заметность поисковой строки

Чтобы посетители чаще пользовались поисковой строкой, она должна быть заметной. Если потеряется в массе контента — вероятнее всего, ей никто не будет пользоваться. Зачем размещали — неизвестно. Постарайтесь прикрутить поисковик в самом видном месте. И старайтесь избегать размещения в сроке лого Гугла или Яндекса — люди теряются и думают, что это не поиск по сайту, а просто поисковик.

Срока размещена плохо. Она теряется в массе других кнопок и разделов, ее легко пропустить.

Хороший пример. Такую строку не должны пропустить.

0 результатов

Делайте так, чтобы в поисковой выдаче не было фразы «ничего не найдено». Совсем. Даже если посетитель спрашивает какую-то несвязную безумную хрень. И тем более, если человек допустил банальную опечатку. Если совсем ничего не подходит — настройте так, чтобы выдавало страницу с акциями и скидками.

Запомните: поисковая строка — этап воронки. «Ничего не найдено» — дыра в этой воронке, куда проваливаются несостоявшиеся клиенты. Если люди пользуются вашим поиском — они теплые, прогретые клиенты, готовые к коммуникации. Если вы предлагаете им пустую страницу — теряете заинтересованных клиентов.

Мегафон показывает как не надо делать. Небольшая опечатка — бац, и «ничего не найдено».

Максимум инфы в выдаче

Мало просто показать заголовок карточки. Мало даже добавить к ней описание. Добавляйте в поисковой выдаче и подсказках инфы по-максимуму: характеристики, рейтинг, цену, фотографии и другое, что позволяет ваша платформа. Вы упростите задачу пользователю, он оценит и скажет вам спасибо.

Уже на этапе подсказок поисковый сервис показывает нам карточки товаров с ценой, названием, артикулом и фотографией. И это мы еще не нажали «поиск». Удобно.

Фильтр и сортировка

Настоящие боги продаж делают не просто умный поиск. В дополнение к нему прикручивают фильтр и сортировку— чтобы люди могли посмотреть, что есть в наличии, задать ценовой диапазон, поставить от дешевых к дорогим. Людям будет проще искать — они будут чаще приходить к вам за покупками.

Когда в результатах поисковой выдачи есть фильтр и сортировка, можно сразу отсечь ненужные результаты. Пользователь не будет просматривать весь каталог сайта и быстрее найдет то, что нужно.

Похожие товары

Чтобы продавать больше, кроме релевантных товаров в выдаче, показывайте похожие позиции. Вдруг пользователю понравится — он начнет дальше бродить по сайту в поисках подходящего продукта.

Коротко: как работает умный поиск

  1. Умный поиск — это как обычный внутренний поиск на сайте, только с расширенными возможностями. Он распознает ошибки, понимает слова с опечатками и словоформами, ищет по синонимам и по словам в английской раскладке. Как настоящий поисковик, только у вас на сайте
  2. Алгоритм работы умного поиска — адово сложная штука. Разбираются в нем только узкие специалисты. А разработкой занимаются единицы. Поэтому не стоит мечтать о своем движке — зря потратите время. Используйте те решения, которые есть в доступе
  3. Работа строится так: сначала движок сканирует каталог, потом дробит все названия в нем на слова, затем на триграммы. Каждая триграмма получает свой идентификатор. Когда пользователь введет запрос, алгоритм найдет совпадения по триграммам и выдаст наиболее точный результат. Даже если запрос введен с ошибкой, опечаткой, в виде синонима, латинскими символами или все вместе
  4. Умный поиск помогает продавать больше. Но мало просто прикрутить строку на сайт и ждать результатов. Оптимизируйте выдачу, работайте над качеством результатов, повышайте заметность и исследуйте аналитику. Работайте как профессионал :)
Поделитесь мнением о статье

Статья помогла вам?
Да Нет
Благодарим за оценку!

Ваши оценки помогают сделать блог еще лучше и информативнее.

Вы можете ознакомиться с другими статьями по этой теме ↓ и подписаться на рассылку о новых статьях (спамить не будем, обещаем:)

Положительно оценили статью: 1 пользователь
Новые статьи каждую неделю
Подпишитесь, чтобы ничего не пропустить