Les sous-projets > SP 3 - Agrégation de contenu faiblement structurés > Tâche 3.1 : Agrégation automatique de corpus Web > Activité de la 1ère année (2013) >
Livrables
File name | Description | Size | Rev. | Time | User |
---|
Selection | File type icon | File name | Description | Size | Revision | Time | User |
---|---|---|---|---|---|---|---|
ċ
|
Afficher |
Présentation de la solution de veille Ask'n'Read développée par QWAM, qui doit permettre dans le cadre d'INTER-TEXTES d'agréger un corpus de sources sur la thématique « sciences humaines », auto alimenté par la nouveauté des informations du web et la découverte de nouvelles sources. Ce rapport présente le fonctionnement de l'outil de veille ainsi que ses objectifs dans le cadre de la création d'un automate de découverte et de capture de sources web sur les sciences humaines. | 10 déc. 2015, 07:32 | Ivan Monnier | |||
Ā | Afficher |
Présentation des travaux effectués dans le cadre de la tache 3.3 qui a pour objectif d’enrichir, de façon (semi) automatique, les métadonnées associés aux contenus qui auront été agrégés à l’aide des outils des tâches 3.1 (agrégation automatique) et 3.2 (agrégation éditoriale ou manuelle).Pour cela, nous emploierons des méthodes de détection de mots-clés et de création de signatures ou d’empreintes des ressources, des méthodes de détection automatique d’entités nommées (noms propres, noms d’organisation, lieux, dates…). Dans un premier temps, nous proposons une méthode de détection automatique d’entités nommées basée sur l’outil logiciel GATE. Nous présenterons l’outil, son fonctionnement et sa mise en oeuvre dans le cadre d’Inter-textes. | 10 déc. 2015, 07:32 | Ivan Monnier | |||
ċ
|
Afficher |
Slides de présentation des travaux de Qwam sur l'aggrégation de contenus | 10 déc. 2015, 07:35 | Ivan Monnier |