Информация о статье

2025 г., Том 30, № 6, с.98-108

Краснов Ф.В., Курушин Ф.И.

Модель C2T для сокращения разнообразия поисковых запросов в e-commerce при помощи механизма self-attention

В электронной коммерции хорошо известна проблема “длинного хвоста” запросов, препятствующая созданию эффективных обратных индексов по строковым представлениям запросов. Подходы к сокращению разнообразия поисковых запросов на основании текстовой близости, нечеткого хеширования и коллаборативной парадигмы широко применяются, но имеют ограничения при обработке предметных сущностей (брендов, характеристик товаров и предметов), критически значимых для продуктового поиска. В исследовании предложен подход к позиционному взвешиванию токенов поискового запроса на основании влияния контекста запроса с учетом предметных сущностей. Реализация данного подхода в виде модели машинного обучения C2T позволила уменьшить разнообразие поисковых запросов на 48 % по показателю “перплексия”.


Ключевые слова: переформулировка запросов, индекс запросов, смысловая оценка, обратный индекс, перплексия

doi: 10.25743/ICT.2025.30.6.007

Библиографическая ссылка:
Краснов Ф.В., Курушин Ф.И. Модель C2T для сокращения разнообразия поисковых запросов в e-commerce при помощи механизма self-attention // Вычислительные технологии. 2025. Т. 30. № 6. С. 98-108
Главная| Цели| Редколлегия| Содержание| Поиск| Подписка| Правила| Контакты
ISSN 1560-7534
© 2025 ФИЦ ИВТ, Новосибирск