Les sous-projets > SP 3 - Agrégation de contenu faiblement structurés > Tâche 3.4 : Outils en vue de la validation des sources et des contenus > Activité de la 2ème année (2014) >
Livrables
Selection | File type icon | File name | Description | Size | Revision | Time | User |
---|---|---|---|---|---|---|---|
ċ
|
Afficher |
Parmi les solutions développées par QWAM, nous citons les solutions de veille informationnellebasés sur plusieurs sources. Parmi ces dernières, nous citions les flux RSS auquel nous nousintéressons dans ce travail. Devant la variété thématique des flux de données et l’absence d’uneclassification thématique préétablie de ces flux, la qualité des métadonnées a besoin d’êtreaméliorée pour faciliter la définition des veilles et diminuer le taux de bruit dans les résultatsimportés. L’objectif principal de ce travail consiste à réduire le travail manuel de la définition deveilles après l’agrégation des flux de données non structurées. Une des solutions décrite dans cerapport consiste à relier ces contenus non structurés à des métadonnées en relation avec l'identitésémantique des données annotées. Ce rapport présente la mise en œuvre d’un composantd’enrichissement sémantique des flux de données RSS. L’outil Gate a été choisi parmi lespossibilités. Nous décrivons également le résultat de l’application du composant d’enrichissementsémantique dans la veille de flux RSS de la presse médicale et justifions nos choix par le retourd’expérience acquis.Le présent document codé F3.3.1 présente les travaux effectués dans le cadre de la tache 3.3 qui apour objectif d’enrichir, de façon (semi-) automatique, les métadonnées associés aux contenus quiauront été agrégés à l’aide des outils des tâches 3.1 (agrégation automatique) et 3.2 (agrégationéditoriale ou manuelle). | 23 mars 2016, 04:20 | Ivan Monnier |