Tâche 6.3 : Recommandations par analyse de logs


Description de la tâche :

L’enjeu de la tâche 6.3 est de prendre en compte les usages (exprimés sous la forme de logs) dans notre approche de recommandations. On pourra débruiter et analyser les logs des sessions de recherche sur les portails du Cléo ou les applications de Qwam pour construire des profils-types de lecteurs et – ainsi – proposer des contenus à d’autres lecteurs ayant le même profil. On pourra également croiser des analyses de logs et des analyses de contenus.

Avant cela, nous étudierons les résultats et les caractéristiques des différentes approches testées à l’occasion de la piste ‘Session Track’ des évaluations TREC. De fait, la ‘Session Track’4 se propose de mesurer l’impact de l’usage de l’historique d’une session de recherche dans le processus de recherche d’information. En 2010, une session y avait été volontairement limitée à deux requêtes correspondant à trois types de reformulation possibles : la généralisation (‘low carb high fat diet’ ‘types of diets’), la restriction (‘US map’ ‘US map states and capitals’) et la multiplicité des points de vue ou facettes (‘music man performances’ ‘music man script’).

Par ailleurs, nous tirerons parti des résultats du projet ANR CAAS (« Contextual Analysis and Adaptive Search »), dans lequel le LSIS est partie prenante et dont l’un des volets concerne l’analyse de logs pour des moteurs de recherche d’information généralistes. N.B. : le Cléo est l’un des fournisseurs de logs de ce projet.