Одной из задач, затронутых на последних конференциях ACM RecSys (главные международные форумы по рекомендательным системам), стала так называемая проблема постоянного холодного старта рекомендательных систем [1].
Широко известна классическая проблема холодного старта (Cold-start Problem, CSP). В рекомендательной системе, предлагающей «пользователям» некие определенные «объекты» на основании имеющейся истории предпочтений, она возникает тогда, когда в этой отлаженной схеме появляются новые элементы. Это — либо новый пользователь, история предпочтений которого пуста, либо новый объект, не выбранный пока ни одним пользователем. Многим известно, что алгоритмы коллаборативной фильтрации (как, впрочем, и многие другие методы) в изначальном своем виде неприменимы к подобным ситуациям. Однако во многих реальных ситуациях CSP часто приобретает характер циклической проблемы для уже известных пользователей или объектов — например, в случаях, когда часть пользователей появляется в системе редко, меняет свои интересы (так называемая волантильность пользователей). Данная задача получила название проблема постоянного холодного старта (Continuous Cold-start Problem, CoCoS).
Решение задачи CSP определяется типом рекомендуемых объектов — например, широко известны практики использования базовых наборов рекомендаций и использования гибридных систем, сочетающих в себе комбинации коллаборативной фильтрации и контентных рекомендаций (появление которых, в общем-то, очевидно в случаях, если объектам можно назначить описательные дескрипторы). При доступе к сторонним данным распространены практики извлечения вспомогательной информации, например, из социальных сетей. Однако все эти способы не подходят в случае проблемы CoCoS, поскольку предполагают, что после того, как пользователь стал «известным», он остается таким неограниченное количество времени.
Как и в случае CSP, проблема CoCoS может иметь форму одного из следующих двух типов — CoCoS по пользователям (User Continuous Cold-Start) и CoCoS по объектам (Item Continuous Cold-Start). Первый случай, уже затронутый нами, возникает при обнаружении в системе новых или редко появляющихся пользователей. Второй — при наличии новых объектов либо таких, свойства которых могут измениться со временем. В случае нативных рекомендаций, например, это такие статьи, содержание которых может быть изменено авторами (вопреки ожиданиям, это довольно частая ситуация).
Наиболее частый подход при решении задач CoCoS — это комбинирование коллаборативной фильтрации и контентных методов при предположении, что «похожим» пользователям понравятся «похожие объекты». Подобный способ отлично решает проблему Item Continuous Cold-Start. Однако для случая User Continuous Cold-Start, когда «похожесть» пользователей определить невозможно, и он становится бессилен. На ACM RecSys было предложено еще несколько алгоритмов, например, метод «контекстного многорукого бандита» (Tang et al [2]), и алгоритм для решения проблемы пользовательской волантильности (Sun et al. [3]). Также отметим предложенный метод на основе тем (Tavakol and Brefeld [4]). Метод моделирует намерения пользователя через вероятностное распределение тем над объектами. При взаимодействии пользователя с системой намерение пользователя предсказывается через марковский процесс. Метод был апробирован на реальных данных из систем e-commerce, эксперименты показали существенное повышение эффективности рекомендаций.
Отметим, что при проектировании любой рекомендательной системы важно понимать все аспекты среды, в которой подразумевается ее применение, и учитывать это при разработке. Проблема CoCoS — одна из таких особенностей: если эффективность системы стоит не на последнем месте, нельзя пренебрегать ею или «округлять» ее до задачи CSP.
1. Lucas Bernardi, Jaap Kamps, Julia Kiseleva, Melanie J.I. Mueller The Continuous Cold Start Problem in e-Commerce Recommender Systems, 2015
2. L. Tang, Y. Jiang, L. Li, and T. Li. Ensemble contextual bandits for personalized recommendation. In Proceedings of the 8th ACM Conference on Recommender Systems, pages 73–80, 2014.
3. J. Z. Sun, K. R. Varshney, and K. Subbian. Dynamic matrix factorization: A state space approach. In IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pages 1897–1900, 2012.
4. M. Tavakol and U. Brefeld. Factored mdps for detecting topics of user sessions. In Proceedings of the 8th ACM Conference on Recommender Systems, pages 33–40, 2014