1 |
Morphology in the Corsican Language Database (BDLC) : assessment and perspectives ; La morphologie dans la Banque de Données Langue Corse : bilan et perspectives
|
|
|
|
In: ISSN: 1638-9808 ; EISSN: 1765-3126 ; Corpus ; https://hal.archives-ouvertes.fr/hal-03591866 ; Corpus, Bases, Corpus, Langage - UMR 7320, 2022, Corpus et données en morpholgie, ⟨10.4000/corpus.7115⟩ ; https://journals.openedition.org/corpus/7115 (2022)
|
|
Abstract:
International audience ; Since the late 1970s, the NALC-BDLC programme has been collecting dialectal data from native speakers throughout Corsica and northern Sardinia. Ethnolinguistic field surveys are conducted in the form of semi-directed interviews with the help of thematic questionnaires. This long-term undertaking has made it possible to gather a rich linguistic material, but has also undergone various methodological and technological evolutions, making the current version partial. Before describing the analysis carried out to fill these gaps, the possibilities offered today are outlined and put into perspective in relation to those of the historical version. However, our approach goes beyond the "simple restoration" of the system and is planned in two directions: on the one hand, the implementation of a research project that will strengthen the morphological and syntactic dimensions of the database, and on the other hand, the application of Natural Language Processing (NLP) techniques for the development of the programme. ; Depuis la fin des années 1970, le programme NALC-BDLC collecte des données dialectales auprès de locuteurs natifs dans l’ensemble de la Corse et dans le nord de la Sardaigne. Les enquêtes ethnolinguistiques de terrain sont menées sous la forme d’entretiens semi-dirigés avec l’aide de questionnaires thématiques. Cette entreprise au long cours a permis de rassembler un matériel linguistique riche, mais a parallèlement connu diverses évolutions – méthodologiques et technologiques – rendant la version actuelle partielle. Avant de décrire l’analyse menée pour combler ces déficits, les possibilités offertes aujourd’hui sont exposées et mises en perspectives par rapport à celles de la version historique. Notre démarche dépasse cependant la « simple restauration » du système et s’envisage en deux directions : d’une part la mise en œuvre d’un projet de recherches qui renforcera les dimensions morphologie et syntaxe de la base, d’autre part l’application des techniques du Traitement Automatique du Langage (TAL) pour le développement du programme.
|
|
Keyword:
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; automatic inflection; corse; Corsican; derivational and inflectional morphology; diachronie; diachrony; flexion automatique; lemma; lemme; morphologie dérivationnelle et flexionnelle; NLP; synchronie; synchrony; TAL
|
|
URL: https://hal.archives-ouvertes.fr/hal-03591866 https://doi.org/10.4000/corpus.7115
|
|
BASE
|
|
Hide details
|
|
2 |
La morphologie dans la Banque de Données Langue Corse : passé, présent, futur
|
|
|
|
In: ISSN: 1638-9808 ; EISSN: 1765-3126 ; Corpus ; https://hal.archives-ouvertes.fr/hal-03520813 ; Corpus, Bases, Corpus, Langage - UMR 7320, A paraître (2022)
|
|
BASE
|
|
Show details
|
|
3 |
Language identification, a tool for Corsican and for the evaluation of linguistic resources ; L'identification de langue, un outil au service du corse et de l'évaluation des ressources linguistiques
|
|
|
|
In: Traitement Automatique des Langues ; https://hal.archives-ouvertes.fr/hal-03633290 ; Traitement Automatique des Langues, 2022, Diversité Linguistique, 62 (3), pp.13-37 ; https://www.atala.org/content/diversité-linguistique-linguistic-diversity-natural-language-processing (2022)
|
|
BASE
|
|
Show details
|
|
4 |
A Survey of Language Technologies Resources and Tools for Corsican
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03228733 ; [Research Report] UMR 6240 CNRS LISA - Université de Corse. 2021 (2021)
|
|
BASE
|
|
Show details
|
|
5 |
Towards a Corsican Basic Language Resource Kit
|
|
|
|
In: 12th Language Resources and Evaluation Conference (LREC 2020) ; https://hal.archives-ouvertes.fr/hal-02865699 ; 12th Language Resources and Evaluation Conference (LREC 2020), May 2020, Marseille, France (2020)
|
|
BASE
|
|
Show details
|
|
6 |
Copyright in the context of tooling up Corsican and other less-resourced languages
|
|
|
|
In: International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide ; https://hal.archives-ouvertes.fr/hal-02880713 ; International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide, Dec 2019, Paris, France (2019)
|
|
BASE
|
|
Show details
|
|
7 |
Tooling up a less-resourced language with NLP : the example of Corsican and the BDLC
|
|
|
|
In: International Conference on Language Technologies for All (LT4All) Enabling Linguistic Diversity and Multilingualism Worldwide ; https://hal.archives-ouvertes.fr/hal-02880729 ; International Conference on Language Technologies for All (LT4All) Enabling Linguistic Diversity and Multilingualism Worldwide, Dec 2019, Paris, France (2019)
|
|
BASE
|
|
Show details
|
|
8 |
Tooling up a less-resourced language with NLP : the example of Corsican and BDLC ; Outiller une langue peu dotée grâce au TALN : l’exemple du corse et BDLC
|
|
|
|
In: 26e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02567779 ; 26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.371-380 (2019)
|
|
BASE
|
|
Show details
|
|
9 |
Tooling up a less-resourced language with NLP : the example of Corsican and BDLC ; Outiller une langue peu dotée grâce au TALN : l’exemple du corse et BDLC
|
|
|
|
In: 26e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02452276 ; 26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.371-380 (2019)
|
|
BASE
|
|
Show details
|
|
10 |
Outiller une langue peu dotée grâce au TALN : l’exemple du corse et de la BDLC
|
|
|
|
In: 26e conférence sur le Traitement automatique des langues naturelles (TALN) ; https://hal.archives-ouvertes.fr/hal-03146186 ; 26e conférence sur le Traitement automatique des langues naturelles (TALN), Jul 2019, Toulouse, France. ATALA, pp.371-380, 2019 (2019)
|
|
BASE
|
|
Show details
|
|
11 |
Hybrid supervised classification through extended lexical patterns and SVM classifiers ; Classification supervisée hybride par motifs lexicaux étendus et classificateurs SVM
|
|
|
|
In: 10th International Conference on statistical analysis of textual data (JADT 2010) ; https://hal.archives-ouvertes.fr/hal-02454106 ; 10th International Conference on statistical analysis of textual data (JADT 2010), Jun 2010, Rome, Italie (2010)
|
|
BASE
|
|
Show details
|
|
12 |
Towards a biographical knowledge base: information extraction and ontology ; Vers une base de connaissances biographique : extraction d’information et ontologie
|
|
|
|
In: Actes des cinquièmes journées Extraction et Gestion des Connaissances ; Extraction et gestion des connaissances (EGC'2007) ; https://hal.archives-ouvertes.fr/hal-03515763 ; Extraction et gestion des connaissances (EGC'2007), Jan 2007, Namur, Belgique. pp.373--378 ; https://editions-rnti.fr/?inprocid=1001400 (2007)
|
|
BASE
|
|
Show details
|
|
13 |
MOCA – Multimedia Oral Corpora Administration. Un système de gestion et d'annotation de données orales
|
|
|
|
In: Corpus et pragmatique. L'interaction verbale dans son contexte situationnel à la lumière des corpus et des bases de données. 3ème Rencontre Fribourgeoise de la Linguistique sur Corpus ; https://hal.archives-ouvertes.fr/hal-03089564 ; Corpus et pragmatique. L'interaction verbale dans son contexte situationnel à la lumière des corpus et des bases de données. 3ème Rencontre Fribourgeoise de la Linguistique sur Corpus, Sep 2006, Fribourg-en-Brisgau, Allemagne (2006)
|
|
BASE
|
|
Show details
|
|
15 |
Adaptation des ressources d’Unitex au traitement du grec ancien
|
|
|
|
In: 24ème conférence internationale grammaires et lexiques comparés ; https://hal.archives-ouvertes.fr/hal-03089594 ; 24ème conférence internationale grammaires et lexiques comparés, Sep 2005, Liverpool, Royaume-Uni (2005)
|
|
BASE
|
|
Show details
|
|
16 |
Traitement automatisé de l'ambiguïté lexicale en grec ancien. Première approche par application de grammaires locales
|
|
|
|
In: 23ème conférence internationale grammaires et lexiques comparés ; https://hal.archives-ouvertes.fr/hal-03089602 ; 23ème conférence internationale grammaires et lexiques comparés, Nov 2004, Deauville, France (2004)
|
|
BASE
|
|
Show details
|
|
|
|