Description de la tâche : La recommandation par analyse du voisinage consiste à analyser les contenus (au-delà des citations et références, traitées en tâche 6.1) en fonction de leur « position » : contenus effectivement liés par des hyperliens, contenus du même auteur, contenus thématiquement proches (appartenant aux mêmes catégories thématiques et/ou partageant les mêmes méta-données), contenus référencés par une communauté d’utilisateurs (i.e. reliés par l’intermédiaire des recommandations d’utilisateurs)... Il s’agit donc d’exploiter les connexions entre ressources, c’est-à-dire les graphes de liens, en désignant par « ressources » les textes eux-mêmes mais aussi les utilisateurs abonnés aux carnets de recherche et aux fils de discussions. Pour cela, nous ferons appel à des méthodes de détection de textes thématiquement proches ou de détection de ressources stylistiquement proches pour enrichir l’univers des liens entre ressources en se fondant sur les méthodes de clustering les plus performantes telles que l’analyse sémantique latente (probabiliste – PLSA – et Latent Dirichlet Allocation – LDA).
|