DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...7
Hits 1 – 20 of 124

1
State of the art on the alignment of ontologies ; Etat de l'art sur l'alignement des ontologies
In: ISSN: 1638-5713 ; Revue Africaine de la Recherche en Informatique et Mathématiques Appliquées ; https://hal.inria.fr/hal-03330388 ; 2021 (2021)
BASE
Show details
2
Knowledge engineering in the sourcing domain for the recommendation of providers ; Ingénierie des connaissances dans le domaine du sourcing pour la recommandation de prestataires
Tounsi Dhouib, Molka. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03336353 ; Information Retrieval [cs.IR]. Université Côte d'Azur, 2021. English. ⟨NNT : 2021COAZ4024⟩ (2021)
BASE
Show details
3
Leveraging lyrics from audio for MIR ; Exploiter les paroles de chansons à partir de l'audio pour le MIR
Vaglio, Andrea. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03558515 ; Signal and Image processing. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAT027⟩ (2021)
BASE
Show details
4
Aligner pour mieux diffuser, l'expérience du thésaurus PACTOLS pour l'archéologie avec Wikidata
In: Wiki, data et GLAM 2021. Webinaire ; https://halshs.archives-ouvertes.fr/halshs-03248607 ; Wiki, data et GLAM 2021. Webinaire, Wikimedia France; Etalab, Jun 2021, En ligne, France (2021)
BASE
Show details
5
Graph Algorithms for Multiparallel Word Alignment
In: Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing ; The 2021 Conference on Empirical Methods in Natural Language Processing ; https://hal.archives-ouvertes.fr/hal-03424044 ; The 2021 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Nov 2021, Punta Cana, Dominica ; https://2021.emnlp.org/ (2021)
BASE
Show details
6
Comparaison dialectométriques de parlers du Croissant avec d'autres parlers d'oc et d'oïl
In: Le Croissant linguistique entre oc, oïl et francoprovençal : des mots à la grammaire, des parlers aux aires ; https://hal.archives-ouvertes.fr/hal-03318765 ; Le Croissant linguistique entre oc, oïl et francoprovençal : des mots à la grammaire, des parlers aux aires, 2021 (2021)
BASE
Show details
7
Marcar o no marcar las fronteras: la variación como recurso lingüístico en las prácticas multilingües
In: Prácticas lingüísticas heterogéneas: Nuevas perspectivas para el estudio del español en contacto con lenguas amerindias ; https://hal.archives-ouvertes.fr/hal-03483909 ; Santiago Sánchez Moreano; Elodie Blestel. Prácticas lingüísticas heterogéneas: Nuevas perspectivas para el estudio del español en contacto con lenguas amerindias, Language Science Press, pp.49-67, 2021, ⟨10.5281/zenodo.5643281⟩ ; https://langsci-press.org/catalog/book/236 (2021)
BASE
Show details
8
Marcar o no marcar las fronteras: la variación como recurso lingüístico en las prácticas multilingües
In: Prácticas lingüísticas heterogéneas: Nuevas perspectivas para el estudio del español en contacto con lenguas amerindias ; https://hal.archives-ouvertes.fr/hal-03483909 ; Santiago Sánchez Moreano; Elodie Blestel. Prácticas lingüísticas heterogéneas: Nuevas perspectivas para el estudio del español en contacto con lenguas amerindias, Language Science Press, pp.49-67, 2021, ⟨10.5281/zenodo.5643281⟩ ; https://langsci-press.org/catalog/book/236 (2021)
BASE
Show details
9
Lexique multilingue alsacien – français – allemand relié aux synsets de BabelNet ... : Alsatian - French - German multilingual lexicon linked to BabelNet synsets ...
Delphine Bernhard. - : NAKALA - https://nakala.fr (Huma-Num - CNRS), 2021
BASE
Show details
10
Unsupervised cross-lingual representation modeling for variable length phrases ; Apprentissage de représentations cross-lingue d’expressions de longueur variable
Liu, Jingshu. - : HAL CCSD, 2020
In: https://hal.archives-ouvertes.fr/tel-02938554 ; Computation and Language [cs.CL]. Université de Nantes, 2020. English (2020)
BASE
Show details
11
SimAlign: High Quality Word Alignments Without Parallel Training Data Using Static and Contextualized Embeddings
In: EMNLP 2020 ; https://hal.archives-ouvertes.fr/hal-03013194 ; EMNLP 2020, Association for Computational Linguistics, Nov 2020, Online, United States. pp.1627 - 1643 (2020)
BASE
Show details
12
Lénition et fortition des occlusives en coda finale dans deux langues romanes : le français et le roumain
In: Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole ; https://hal.archives-ouvertes.fr/hal-02798551 ; 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). Volume 1 : Journées d'Études sur la Parole, 2020, Nancy, France. pp.289-298 (2020)
BASE
Show details
13
Alignement temporel entre transcriptions et audio de données de langue japhug
In: Actes des 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT). ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) ; https://hal.archives-ouvertes.fr/hal-03047146 ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), Dec 2020, Montrouge (virtuel), France. pp.9-22 (2020)
BASE
Show details
14
Alignement temporel entre transcriptions et audio de données de langue japhug
In: Actes des 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT). ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT) ; https://hal.archives-ouvertes.fr/hal-03047146 ; 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), Dec 2020, Montrouge (virtuel), France. pp.9-22 (2020)
BASE
Show details
15
Open source quality control tool for translation memory using artificial intelligence
BASE
Show details
16
Unsupervised word discovery for computational language documentation ; Découverte non-supervisée de mots pour outiller la linguistique de terrain
Godard, Pierre. - : HAL CCSD, 2019
In: https://tel.archives-ouvertes.fr/tel-02286425 ; Artificial Intelligence [cs.AI]. Université Paris Saclay (COmUE), 2019. English. ⟨NNT : 2019SACLS062⟩ (2019)
Abstract: Language diversity is under considerable pressure: half of the world’s languages could disappear by the end of this century. This realization has sparked many initiatives in documentary linguistics in the past two decades, and 2019 has been proclaimed the International Year of Indigenous Languages by the United Nations, to raise public awareness of the issue and foster initiatives for language documentation and preservation. Yet documentation and preservation are time-consuming processes, and the supply of field linguists is limited. Consequently, the emerging field of computational language documentation (CLD) seeks to assist linguists in providing them with automatic processing tools. The Breaking the Unwritten Language Barrier (BULB) project, for instance, constitutes one of the efforts defining this new field, bringing together linguists and computer scientists. This thesis examines the particular problem of discovering words in an unsegmented stream of characters, or phonemes, transcribed from speech in a very-low-resource setting. This primarily involves a segmentation procedure, which can also be paired with an alignment procedure when a translation is available. Using two realistic Bantu corpora for language documentation, one in Mboshi (Republic of the Congo) and the other in Myene (Gabon), we benchmark various monolingual and bilingual unsupervised word discovery methods. We then show that using expert knowledge in the Adaptor Grammar framework can vastly improve segmentation results, and we indicate ways to use this framework as a decision tool for the linguist. We also propose a tonal variant for a strong nonparametric Bayesian segmentation algorithm, making use of a modified backoff scheme designed to capture tonal structure. To leverage the weak supervision given by a translation, we finally propose and extend an attention-based neural segmentation method, improving significantly the segmentation performance of an existing bilingual method. ; La diversité linguistique est actuellement menacée : la moitié des langues connues dans le monde pourraient disparaître d'ici la fin du siècle. Cette prise de conscience a inspiré de nombreuses initiatives dans le domaine de la linguistique documentaire au cours des deux dernières décennies, et 2019 a été proclamée Année internationale des langues autochtones par les Nations Unies, pour sensibiliser le public à cette question et encourager les initiatives de documentation et de préservation. Néanmoins, ce travail est coûteux en temps, et le nombre de linguistes de terrain, limité. Par conséquent, le domaine émergent de la documentation linguistique computationnelle (CLD) vise à favoriser le travail des linguistes à l'aide d'outils de traitement automatique. Le projet Breaking the Unwritten Language Barrier (BULB), par exemple, constitue l'un des efforts qui définissent ce nouveau domaine, et réunit des linguistes et des informaticiens. Cette thèse examine le problème particulier de la découverte de mots dans un flot non segmenté de caractères, ou de phonèmes, transcrits à partir du signal de parole dans un contexte de langues très peu dotées. Il s'agit principalement d'une procédure de segmentation, qui peut également être couplée à une procédure d'alignement lorsqu'une traduction est disponible. En utilisant deux corpus en langues bantoues correspondant à un scénario réaliste pour la linguistique documentaire, l'un en Mboshi (République du Congo) et l'autre en Myene (Gabon), nous comparons diverses méthodes monolingues et bilingues de découverte de mots sans supervision. Nous montrons ensuite que l'utilisation de connaissances linguistiques expertes au sein du formalisme des Adaptor Grammars peut grandement améliorer les résultats de la segmentation, et nous indiquons également des façons d'utiliser ce formalisme comme outil de décision pour le linguiste. Nous proposons aussi une variante tonale pour un algorithme de segmentation bayésien non-paramétrique, qui utilise un schéma de repli modifié pour capturer la structure tonale. Pour tirer parti de la supervision faible d'une traduction, nous proposons et étendons, enfin, une méthode de segmentation neuronale basée sur l'attention, et améliorons significativement la performance d'une méthode bilingue existante.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; Alignement bilingue; Apprentissage non-supervisé; Automatic word segmentation; Bayesian models; Bilingual alignment; Langues peu dotées; Low-resource languages; Modèles bayésiens; Segmentation automatique en mots; Unsupervised learning
URL: https://tel.archives-ouvertes.fr/tel-02286425/file/75551_GODARD_2019_archivage.pdf
https://tel.archives-ouvertes.fr/tel-02286425
https://tel.archives-ouvertes.fr/tel-02286425/document
BASE
Hide details
17
Final devoicing of fricatives in French: Studying variation in large-scale corpora with automatic alignment
In: Proceedings of the 19th International Congress of Phonetic Sciences ; 19th International Congress of Phonetic Sciences ; https://hal.archives-ouvertes.fr/hal-02270089 ; 19th International Congress of Phonetic Sciences, 2019, Melbourne, Australia. pp.295-299 ; https://assta.org/proceedings/ICPhS2019/ (2019)
BASE
Show details
18
Édition comparative intermédiale de séries traductives : exploiter les homologies pour créer des visualisations modulables
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.archives-ouvertes.fr/hal-02481181 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2019, TAL et humanités numériques, 60 (3), pp.37-62 (2019)
BASE
Show details
19
Détection des couples de termes translittérés à partir d'un corpus parallèle anglais-arabe
In: Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01899828 ; Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France (2018)
BASE
Show details
20
Filled pause, laughter and noise in spontaneous speech: application to forced-alignment ; euh, rire et bruits en parole spontanée : application à l'alignement forcé
In: Actes des 32èmes journées d'étude sur la parole ; Journées d'études sur la parole ; https://hal.archives-ouvertes.fr/hal-01959445 ; Journées d'études sur la parole, Jun 2018, Aix-en-Provence, France (2018)
BASE
Show details

Page: 1 2 3 4 5...7

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
124
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern