Кейсы

PHP Bitrix Vector Search Embeddings

Похожие кейсы:

ИИ
2026 год

Семантический поиск для каталогов 1С-Битрикс

Замена стандартного поиска Битрикса на векторный с поддержкой семантики. Решение строит индекс embeddings по каталогу товаров и контентным разделам сайта, что позволяет находить релевантные результаты по смыслу запроса, а не только по точному совпадению слов.

Решение интегрируется в стандартный поисковый механизм Битрикса: внешний интерфейс (поле поиска, страница результатов) остаётся прежним, меняется только логика выборки. На бэкенде разворачивается векторная БД (Qdrant, Weaviate или PostgreSQL с pgvector), куда индексируются товары и контент через embeddings от LLM-провайдера.
Индекс обновляется автоматически при добавлении и изменении товаров — через подписку на события Битрикса. Это значит, что новые товары появляются в поиске сразу, без необходимости запускать переиндексацию вручную.

Стандартный поиск в Битриксе работает по точному совпадению токенов, плохо обрабатывает синонимы, опечатки и сложные запросы с несколькими параметрами. В результате клиенты часто не находят то, что ищут, и уходят с сайта без покупки. Требовалось решение, которое понимает смысл запроса, остаётся быстрым на больших каталогах и интегрируется в существующий интерфейс без редизайна.

Для каждого товара рассчитывается embedding (векторное представление) на основе названия, описания и характеристик. При поисковом запросе тот же embedding рассчитывается для текста запроса, и из БД достаются ближайшие по векторной близости товары. Это позволяет находить релевантные результаты по смыслу: запрос «куртка для зимы» вернёт пуховики и парки, даже если в их названии этих слов нет.
Для повышения точности используется гибридный подход: семантический поиск комбинируется с классическим полнотекстовым (BM25) с настраиваемыми весами. Это работает лучше, чем любой из подходов в отдельности.
Производительность поддерживается за счёт правильно настроенного векторного индекса (HNSW): время отклика на каталогах в десятки тысяч позиций остаётся менее 100 мс.

Основные возможности

  • Векторный поиск по embeddings товаров и контента
  • Автоматическое обновление индекса при изменениях в каталоге
  • Понимание сложных многопараметровых запросов
  • Время отклика менее 100 мс на каталогах 10K+ позиций
  • Совместимость с pgvector, Qdrant, Weaviate
  • Гибридный режим: семантика + полнотекстовый поиск
  • Поддержка синонимов и опечаток без ручной настройки
  • Сохранение стандартного интерфейса поиска Битрикса
  • Аналитика поисковых запросов и проблемных мест
  • Подписка на события Битрикса для актуальности индекса