1 |
Codage en chaîne ou en première mention de la coréférence : approcher la structure des chaînes de référence par comparaison des deux annotations
|
|
|
|
In: Actes 5ème Congrès Mondial de Linguistique Française, CMLF'2016 ; 5ème Congrès Mondial de Linguistique Française (CMLF'2016) ; https://hal.archives-ouvertes.fr/hal-01344976 ; 5ème Congrès Mondial de Linguistique Française (CMLF'2016), Laboratoire Ligérien de Linguistique, Jul 2016, Tours, France ; http://cmlf2016.sciencesconf.org/ (2016)
|
|
BASE
|
|
Show details
|
|
2 |
Coreference Resolution for French Oral Data: Machine Learning Experiments with ANCOR
|
|
|
|
In: 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing'2016) ; https://hal.archives-ouvertes.fr/hal-01344977 ; 17th International Conference on Intelligent Text Processing and Computational Linguistics (CICLing'2016), Apr 2016, Konya, Turkey ; http://www.cicling.org/2016/ (2016)
|
|
BASE
|
|
Show details
|
|
3 |
Coreference Resolution for Oral Corpus: a machine learning experiment with ANCOR corpus ; Les coréférences à l'oral : une expérience d'apprentissage automatique sur le corpus ANCOR
|
|
|
|
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://halshs.archives-ouvertes.fr/halshs-01153297 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2015, Traitement automatique du langage parlé, 55 (2), pp.97-121 ; http://www.atala.org/-Volume-55- (2015)
|
|
Abstract:
International audience ; We present CROC (Coreference Resolution for Oral Corpus), the first machine learning system for coreference resolution in French. One specific aspect of the system is that it has been trained on data that are exclusively oral, namely ANCOR (ANaphora and Coreference in ORal corpus), the first corpus in oral French with anaphorical relations annotations. In its current state, the CROC system requires pre-annotated mentions. We detail the features that we chose to be used by the learning algorithms, and we present a set of experiments with these features. The scores we obtain are close to those of state-of-the-art systems for written English. Then we give future works on the design of an end-to-end system for oral and written French. ; Cet article présente CROC (Coreference Resolution for Oral Corpus), le premier sys-tème de résolution des coréférences en français reposant sur des techniques d'apprentissage automatique. Une des spécificités du système réside dans son apprentissage sur des données exclusivement orales, à savoir ANCOR (anaphore et coréférence dans les corpus oraux), le premier corpus de français oral transcrit annoté en relations anaphoriques. En l'état actuel, le système CROC nécessite un repérage préalable des mentions. Nous détaillons les choix des traits – issus du corpus ou calculés – utilisés par l'apprentissage, et nous présentons un ensemble d'expérimentations avec ces traits. Les scores obtenus sont très proches de ceux de l'état de l'art des systèmes conçus pour l'écrit. Nous concluons alors en donnant des perspectives sur la réalisation d'un système end-to-end valable à la fois pour l'oral transcrit et l'écrit.
|
|
Keyword:
[SHS.INFO]Humanities and Social Sciences/Library and information sciences; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Apprentissage artificiel; Coreference Resolution; Corpus de dialogues; Détection de coréférences; Dialogue corpus; Machine learning; Mention-pair model; Modèles à paires de mentions
|
|
URL: https://halshs.archives-ouvertes.fr/halshs-01153297/document https://halshs.archives-ouvertes.fr/halshs-01153297/file/14_TAL.pdf https://halshs.archives-ouvertes.fr/halshs-01153297
|
|
BASE
|
|
Hide details
|
|
4 |
Weighted Krippendorff's alpha is a more reliable metrics for multi- coders ordinal annotations: experimental studies on emotion, opinion and coreference annotation.
|
|
|
|
In: Proceedings of EACL 2014 ; EACL 2014 ; https://hal.archives-ouvertes.fr/hal-00998303 ; EACL 2014, Apr 2014, Gotenborg, Sweden. 10 p (2014)
|
|
BASE
|
|
Show details
|
|
5 |
French Tenses Semantics : a Compositionnal Formalisation ; Sémantique des temps du français : une formalisation compositionnelle
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01136420 ; Informatique. Université de Bordeaux, 2014. Français. ⟨NNT : 2014BORD0065⟩ (2014)
|
|
BASE
|
|
Show details
|
|
6 |
Annotation de la temporalité en corpus : contribution à l'amélioration de la norme TimeML
|
|
|
|
In: Conférence TALN'2014 ; TALN'2014 ; https://hal.archives-ouvertes.fr/hal-01075207 ; TALN'2014, Jul 2014, Marseille, France. pp.F14-2029 ; http://www.taln2014.org/site/ (2014)
|
|
BASE
|
|
Show details
|
|
7 |
Traitement automatique sur corpus de récits de voyages pyrénéens : Une analyse syntaxique, sémantique et temporelle
|
|
|
|
In: JEP-TALN-RECITAL 2012 ; https://hal.archives-ouvertes.fr/hal-00749374 ; JEP-TALN-RECITAL 2012, Jun 2012, Grenoble, France. pp. 43-56 (2012)
|
|
BASE
|
|
Show details
|
|
8 |
Traitement automatique d'un corpus de récits de voyages pyrénéens : Analyse syntaxique, sémantique et pragmatique dans le cadre de la théorie des types
|
|
|
|
In: 3e Congrès Mondial de Linguistique Française ; https://hal.archives-ouvertes.fr/hal-00750750 ; 3e Congrès Mondial de Linguistique Française, Jul 2012, Lyon, France. pp. 2485-2497 (2012)
|
|
BASE
|
|
Show details
|
|
9 |
Hétérogénéité et extraction d'information factuelle dans un corpus de récits de voyage
|
|
|
|
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-00751871 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2012, 3 (187), pp. 127-144 (2012)
|
|
BASE
|
|
Show details
|
|
10 |
Hétérogénéité et extraction d'information factuelle dans un corpus de récits de voyage
|
|
|
|
In: Langages, n 187, 3, 2012-09-01, pp.127-144 (2012)
|
|
BASE
|
|
Show details
|
|
|
|