|
Информация о статье
2025 г., Том 30, № 6, с.98-108
Краснов Ф.В., Курушин Ф.И.
Модель C2T для сокращения разнообразия поисковых запросов в e-commerce при помощи механизма self-attention
В электронной коммерции хорошо известна проблема “длинного хвоста” запросов, препятствующая созданию эффективных обратных индексов по строковым представлениям запросов. Подходы к сокращению разнообразия поисковых запросов на основании текстовой близости, нечеткого хеширования и коллаборативной парадигмы широко применяются, но имеют ограничения при обработке предметных сущностей (брендов, характеристик товаров и предметов), критически значимых для продуктового поиска. В исследовании предложен подход к позиционному взвешиванию токенов поискового запроса на основании влияния контекста запроса с учетом предметных сущностей. Реализация данного подхода в виде модели машинного обучения C2T позволила уменьшить разнообразие поисковых запросов на 48 % по показателю “перплексия”.
Ключевые слова: переформулировка запросов, индекс запросов, смысловая оценка, обратный индекс, перплексия
doi: 10.25743/ICT.2025.30.6.007
Библиографическая ссылка: Краснов Ф.В., Курушин Ф.И. Модель C2T для сокращения разнообразия поисковых запросов в e-commerce при помощи механизма self-attention // Вычислительные технологии. 2025. Т. 30. № 6. С. 98-108
|
|
|
|