Menu

Enseignement

Recherche

Voir le CV

Voir les coordonnées

Visites

 20805 visiteurs

 1 visiteur en ligne

Réseaux sociaux
Recherche - La thèse

Thèse soutenue le 23 juin 2011

Sujet : Point de vue ontologique de fonds documentaire territorialisés indexés

Lien vers le mémoire de thèse
  • Contexte
    Projet défini entre l'entreprise Document Image Solutions (DIS) localisée à Bidart et le Laboratoire Informatique de l'Université de Päu et des Pays de l'Adour (LIUPPA) localisé à Pau.
  • Collaborations :
    • Médiathèque Intercommunale à Dimension Régionale de Pau (MIDR): nous appuis dans le projet en nous fournissant ressources (fonds documentaire territorialisé hybride constitué de documents et de notices descriptives attachées. Ces documents décrivent le territoire des Pyrénées durant la période du XIXè siècle et du XXième siècle;
    • Communauté d'agglomération de Pau : appui logistique par l'accès gratuit aux données géographique Du service SIG de la communauté d'agglomération;
    • Bibliothèque Nationale de France : Mis à disposition du vocabulaire contrôlé RAMEAU utilisé dans un grand nombre de bibliothèques et médiathèques de France pour décrire les fonds documentaires en leur possession.
  • Résumé

    Dans les bibliothèques et les médiathèques, une caractéristique importante des fonds documentaires mis à disposition est qu'ils contiennent d'abondantes références à l'histoire, à la géographie, au patrimoine, en somme au territoire, et il est primordial pour ces centres de valoriser ces spécifi cités territoriales pour répondre à des objectifs d'information et d'éducation.
    Dans ce contexte, nous faisons l'hypothèse qu'en utilisant un point de vue geographique pour modéliser un ensemble de ressources terminologiques utilisées pour indexer un fond documentaire, il est possible de faire émerger une représentation du territoire qui y est implicitement décrite. Concernant la modélisation de la connaissance en géomatique (Discipline ayant pour objet la gestion des données à référence spatiale par l'intégration au moyen de l'informatique des savoirs et des technologies reliées à leur acquisition, leur stockage, leur traitement et leur dif fusion, et principalement : la topométrie, la cartographie, la geodésie, la photogrammétrie et la télédétection (Joliveau, 2004)), de nombreux travaux s'appliquent a construire une représentation sémantique structurée géographique de domaines cibles. Cependant, il ne semble pas exister d'approche permettant de construire une représentation d'un territoire à partir de fonds documentaires annotés. Nous proposons donc une méthodologie complète et automatisée permettant de construire une couche conceptuelle de type ontologie d'un territoire, sur la base d'un fonds documentaire indexe par des experts (cf. figure 1). Nous positionnons nos travaux dans l'extraction et la structuration de la connaissance que nous appliquons dans le domaine de la géomatique en nous appuyant notamment sur des techniques provenant du Traitement Automatique du Langage Naturel.


    Figure 1 : Méthodologie Terridoc
    Nous entendons ici par territoire un ensemble de lieux que l'on peut mettre en relation selon un ensemble de thèmes en fonction d'une période donnée. Ainsi, nous présentons un complément original s'appuyant sur le travail d'indexation réalise par les experts documentalistes sur un fonds documentaire pour faire émerger une ontologie d'un territoire implicitement décrit dans les documents. Une contribution importante de notre travail concerne l'enrichissement de facon incrémentale de la représentation d'un territoire. Nous proposons pour cela une chaîne de TALN qui permet de marquer dans des documents textes annotés un ensemble d'informations spatiales, temporelles et thématiques qui nous sert de base pour l'enrichissement de la représentation d'un territoire. Une perspective à ces travaux est de pouvoir valider notre approche sur plusieurs fonds documentaires d'origines diverses. L'intérêt sera de proposer une méthode qui, sur la base des représentations de territoires obtenues, permettrait d'identi fier et de représenter les spéci ficites de chaque fonds documentaire.
    Mots clés : construction d'ontologies à partir de ressources structurées, indexation, fonds documentaire, territoire, Traitement Automatique du Langage Naturel, vocabulaire contrôlé, information géographique
Membres du jury de thèse :
  • Nathalie Aussenac-Gilles, présidente, IC3, IRIT à l'Université Paul Sabatier, Toulouse
  • Jérôme GENSEL rapporteur, STEAMER, LIG à l'Université Joseph Fourier, Grenoble
  • Amedeo NAPOLI, rapporteur, ORPAILLEUR, LORIA - INRIA Nancy Grand EST
  • Chantal Reynaud, examinatrice, IASI, LRI à l'Université Paris XI, Orsay
  • Mauro GAIO, directeur de thèse, T2I, LIUPPA à l'Université de Pau et des Pays de l'Adour, Pau
  • Alain Du Boisdulier Co-encadrant, Dirigeant entreprise Document Image Solutions, Bidart

Date de création : 03/02/2014 @ 14:11
Dernière modification : 05/02/2014 @ 19:05
Catégorie : Recherche


Imprimer l'article Imprimer l'article

 
Actualités

Recherche :

  • 9/13 mai 2016 : Communications à la conférence ACFAS (84ème conférence de l'ACFAS sur le thème "Points de rencontre").
  • 17/18 mars 2016 : Communication à la conférence CIST 2016 (En quête de territoire(s) ? / Looking for territories?).
  • 19 janvier 2016 : co-organisation de l'atelier GAST dans le cadre de la conférence EGC2016 à Reims.
  • 2015 / 2017 : Coordinateur du groupe de travail GAST (Gestion et Analyse des Données Spatiales et Temporelles
  • Projets en cours :
^ Haut ^