DE eng

Search in the Catalogues and Directories

Hits 1 – 10 of 10

1
Codage en chaîne ou en première mention de la coréférence : approcher la structure des chaînes de référence par comparaison des deux annotations
In: Actes 5ème Congrès Mondial de Linguistique Française, CMLF'2016 ; 5ème Congrès Mondial de Linguistique Française (CMLF'2016) ; https://hal.archives-ouvertes.fr/hal-01344976 ; 5ème Congrès Mondial de Linguistique Française (CMLF'2016), Laboratoire Ligérien de Linguistique, Jul 2016, Tours, France ; http://cmlf2016.sciencesconf.org/ (2016)
BASE
Show details
2
Coreference Resolution for French Oral Data: Machine Learning Experiments with ANCOR
In: 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing'2016) ; https://hal.archives-ouvertes.fr/hal-01344977 ; 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing'2016), Apr 2016, Konya, Turkey ; http://www.cicling.org/2016/ (2016)
BASE
Show details
3
Coreference Resolution for Oral Corpus: a machine learning experiment with ANCOR corpus ; Les coréférences à l'oral : une expérience d'apprentissage automatique sur le corpus ANCOR
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://halshs.archives-ouvertes.fr/halshs-01153297 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2015, Traitement automatique du langage parlé, 55 (2), pp.97-121 ; http://www.atala.org/-Volume-55- (2015)
BASE
Show details
4
Weighted Krippendorff's alpha is a more reliable metrics for multi- coders ordinal annotations: experimental studies on emotion, opinion and coreference annotation.
In: Proceedings of EACL 2014 ; EACL 2014 ; https://hal.archives-ouvertes.fr/hal-00998303 ; EACL 2014, Apr 2014, Gotenborg, Sweden. 10 p (2014)
BASE
Show details
5
French Tenses Semantics : a Compositionnal Formalisation ; Sémantique des temps du français : une formalisation compositionnelle
Lefeuvre, Anais. - : HAL CCSD, 2014
In: https://tel.archives-ouvertes.fr/tel-01136420 ; Informatique. Université de Bordeaux, 2014. Français. ⟨NNT : 2014BORD0065⟩ (2014)
BASE
Show details
6
Annotation de la temporalité en corpus : contribution à l'amélioration de la norme TimeML
In: Conférence TALN'2014 ; TALN'2014 ; https://hal.archives-ouvertes.fr/hal-01075207 ; TALN'2014, Jul 2014, Marseille, France. pp.F14-2029 ; http://www.taln2014.org/site/ (2014)
BASE
Show details
7
Traitement automatique sur corpus de récits de voyages pyrénéens : Une analyse syntaxique, sémantique et temporelle
In: JEP-TALN-RECITAL 2012 ; https://hal.archives-ouvertes.fr/hal-00749374 ; JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. pp. 43-56 (2012)
BASE
Show details
8
Traitement automatique d'un corpus de récits de voyages pyrénéens : Analyse syntaxique, sémantique et pragmatique dans le cadre de la théorie des types
In: 3e Congrès Mondial de Linguistique Française ; https://hal.archives-ouvertes.fr/hal-00750750 ; 3e Congrès Mondial de Linguistique Française, Jul 2012, Lyon, France. pp. 2485-2497 (2012)
Abstract: International audience ; Cet article décrit les étapes qui composent notre analyse du discours, en partant du texte brut, et pour en produire une représentation sémantique dans le cadre de la Discourse Representation Theory, désormais DRT (Kamp and Reyle, 1993). Une chaîne complète de traitement est proposée et testée sur le corpus Itipy, "Itinéraires Pyrénéens", lequel a été proposé par la médiathèque de Pau. Le premier but applicatif consiste à attacher un lieu aux portions de texte narrant une action dans ce lieu. Nous exploitons alors ce corpus de récits de voyage du XIXème siècle dans l'objectif d'extraire automatiquement les itinéraires décrits et afin d'indexer les portions de texte prenant effectivement pour décors les lieux géographiques en question. Notre outil, Grail est un parser pour grammaire logique de types avec un ensemble restreint de règles fixes et utilisant un lexique riche. Tout d'abord, la première phase a consisté en l'acquisition de la grammaire sur un corpus annoté (Paris 7 Treebank). Ce corpus nous a permis d'obtenir les informations grammaticales propres aux unités du lexique de la langue française présentes dans le corpus, le lexique produit ne contient donc pas la totalité des mots du français et contient plusieurs catégories pour les entrées les plus fréquentes. Dans la chaine de traitement, la méthode d'attribution de la catégorie intègre une approche statistique : lors- qu'un mot est absent du lexique, l'analyse propose une catégorie ou lorsqu'il présente plusieurs catégories possibles, elle sélectionne la plus appropriée. Chaque mot du texte est taggé, puis supertaggé en fonction des autres unités se trouvant dans son contexte proche (la phrase). Le supertagger propose plusieurs formules qui correspondent à une analyse syntaxique partielle pour chaque phrase du texte dans le cadre des grammaires catégorielles, et plus précisément du calcul de Lambek. S'ensuit une étape de combinaison de toutes les analyses partielles pour donner l'analyse globale. La structure obtenant la meilleure probabilité étant sélectionnée, on garde cette structure comme organisation du calcul de la représentation sémantique en fonction des unités qui la composent. On associe alors à chaque mot son λ-terme à partir du lexique sémantique cette fois et dont la formule correspond à celle présente dans le lexique grammatical pour cette même entrée (Moot, 2010). Le λ -terme pour chaque unité sémantique est saisi à la main dans le style de la λ -DRT. La représentation sémantique étant produite automatiquement à partir de l'analyse syntaxique, nous obtenons une représentation logique sémantique bien formée. La dimension pragmatique quant à elle ne peut être reléguée à un plan inférieur dans l'interprétation du discours. En effet, une analyse du discours impose de fait une interaction entre la sémantique des unités de langue dont on doit interpréter le sens en discours et la prise en compte de la dimension pragmatique de ce qui est dit. Notre approche s'inspire de l'approche de Busquets et al. (2001), "une théorie de l'interprétation des discours doit être aussi en fait une théorie de la sémantique, de la pragmatique, et de leur interaction, c'est-à-dire une théorie de l'interface pragmatique-sémantique" . Certains phénomènes sémantiques restent cependant difficiles à traiter, certains cas de glissement de sens montrent qu'une flexibilité dans le typage doit être permise, alors que dans les cas les plus courants le typage doit être rigide pour éviter une repré- sentation inappropriée. Nous donnerons quelques exemples à propos et proposons donc afin d'améliorer les résultats de notre chaîne traitement de traiter ces phénomènes par l'affinement des λ -termes du lexique dans le cadre du système F, λ -calcul d'ordre supérieur. Nous détaillerons ici notre corpus et nos objectifs applicatifs quant à celui-ci, nous présenterons les étapes de traitement du discours, commençant par l'acquisition de la grammaire du français sur corpus annoté, puis l'analyse syntaxique dans le cadre des grammaires catégorielles. Nous expliquerons plus amplement l'interface syntaxe-sémantique dans la théorie des types logiques permettant la construction de nos repré- sentations sémantiques en λ-DRT. Nous présenterons le système F et notre traitement des phénomènes discursifs mettant en jeu l'interaction sémantique-pragmatique puis nous présenterons les perspectives de ce travail.
Keyword: [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-FL]Computer Science [cs]/Formal Languages and Automata Theory [cs.FL]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; compositionalité; grammaire catégorielle; interface sémantique-pragmatique; interface syntaxe-sémantique; récit de voyage; théorie des types
URL: https://hal.archives-ouvertes.fr/hal-00750750/document
https://hal.archives-ouvertes.fr/hal-00750750/file/CMLFLMR.pdf
https://hal.archives-ouvertes.fr/hal-00750750
BASE
Hide details
9
Hétérogénéité et extraction d'information factuelle dans un corpus de récits de voyage
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-00751871 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2012, 3 (187), pp. 127-144 (2012)
BASE
Show details
10
Hétérogénéité et extraction d'information factuelle dans un corpus de récits de voyage
In: Langages, n 187, 3, 2012-09-01, pp.127-144 (2012)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
10
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern