DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...45
Hits 1 – 20 of 885

1
Meta-Analysis of the Functional Neuroimaging Literature with Probabilistic Logic Programming
In: https://hal.archives-ouvertes.fr/hal-03590714 ; 2022 (2022)
BASE
Show details
2
An Ontology based Smart Management of Linguistic Knowledge
In: EISSN: 2416-5999 ; Journal of Data Mining and Digital Humanities ; https://hal.archives-ouvertes.fr/hal-03618012 ; Journal of Data Mining and Digital Humanities, Episciences.org, In press (2022)
BASE
Show details
3
Aligned and collaborative language-driven engineering ...
Zweihoff, Philip. - : TU Dortmund, 2022
BASE
Show details
4
The Conceptual Metaphor of "Blue" in Vietnamese Language ...
Tran Van Sang1 ,; Nguyen Thi Lien2. - : Zenodo, 2022
BASE
Show details
5
The Conceptual Metaphor of "Blue" in Vietnamese Language ...
Tran Van Sang1 ,; Nguyen Thi Lien2. - : Zenodo, 2022
BASE
Show details
6
A New Ontology-Based Method for Arabic Sentiment Analysis
In: Big Data and Cognitive Computing; Volume 6; Issue 2; Pages: 48 (2022)
BASE
Show details
7
A Comparison of Hybrid and End-to-End ASR Systems for the IberSpeech-RTVE 2020 Speech-to-Text Transcription Challenge
In: Applied Sciences; Volume 12; Issue 2; Pages: 903 (2022)
BASE
Show details
8
A Domain Adaptation-Based Method for Classification of Motor Imagery EEG
In: Mathematics; Volume 10; Issue 9; Pages: 1588 (2022)
BASE
Show details
9
Aligned and collaborative language-driven engineering
BASE
Show details
10
Copyright Basics for OERs
In: Open Educational Resources for Social Sciences (2022)
BASE
Show details
11
The Domain Mismatch Problem in the Broadcast Speaker Attribution Task
In: ISSN: 2076-3417 ; Applied Sciences ; https://hal.archives-ouvertes.fr/hal-03448852 ; Applied Sciences, MDPI, 2021, 11 (18), pp.8521. ⟨10.3390/app11188521⟩ (2021)
BASE
Show details
12
A case-study of language-specific executive disorder
In: ISSN: 0264-3294 ; EISSN: 1464-0627 ; Cognitive Neuropsychology ; https://hal.archives-ouvertes.fr/hal-03372987 ; Cognitive Neuropsychology, Taylor & Francis (Routledge), 2021, 38 (2), pp.125 - 137. ⟨10.1080/02643294.2021.1941828⟩ (2021)
BASE
Show details
13
Simplification automatique de textes biomédicaux en français : les données précises de petite taille aident
In: Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale ; TALN - Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-03509735 ; TALN - Traitement Automatique des Langues Naturelles, Jul 2021, Lille, France (2021)
BASE
Show details
14
Disambiguation of Medical Abbreviations in French with Supervised Methods
In: Studies in Health Technology and Informatics ; https://hal.archives-ouvertes.fr/hal-03335532 ; Studies in Health Technology and Informatics, 2021, ⟨10.3233/shti210171⟩ (2021)
BASE
Show details
15
The diachronic study of genres in architecture: towards a better understanding of recent evolutions in this professional domain
In: 15th Conference of the European Society for the Study of English ; https://hal.archives-ouvertes.fr/hal-03453068 ; 15th Conference of the European Society for the Study of English, Aug 2021, Lyon, France (2021)
BASE
Show details
16
WEIR-P: An Information Extraction Pipeline for the Wastewater Domain
In: RCIS 2021 - 5th International Conference on Research Challenges in Information Science ; https://hal.archives-ouvertes.fr/hal-03211461 ; RCIS 2021 - 5th International Conference on Research Challenges in Information Science, May 2021, Virtual, Cyprus (2021)
BASE
Show details
17
Models of diachronic semantic change using word embeddings ; Modèles diachroniques à base de plongements de mot pour l'analyse du changement sémantique
Montariol, Syrielle. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03199801 ; Document and Text Processing. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG006⟩ (2021)
BASE
Show details
18
Knowledge engineering in the sourcing domain for the recommendation of providers ; Ingénierie des connaissances dans le domaine du sourcing pour la recommandation de prestataires
Tounsi Dhouib, Molka. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03336353 ; Information Retrieval [cs.IR]. Université Côte d'Azur, 2021. English. ⟨NNT : 2021COAZ4024⟩ (2021)
BASE
Show details
19
Robustness of language recognition system to transmission channel ; Robustesse au canal des systèmes de reconnaissance de la langue
Duroselle, Raphaël. - : HAL CCSD, 2021
In: https://hal.archives-ouvertes.fr/tel-03546267 ; Computer Science [cs]. Université de Lorraine, 2021. English. ⟨NNT : 2021LORR0250⟩ (2021)
BASE
Show details
20
Multi-domain Neural Machine Translation ; Traduction automatique neuronale multidomaine
Pham, Minh-Quang. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03546910 ; Artificial Intelligence [cs.AI]. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG109⟩ (2021)
Abstract: Today, neural machine translation (NMT) systems constitute state-of-the-art systems in machine translation. However, such translation models require relatively large train data and struggle to handle a specific domain text. A domain may consist of texts from a particular topic or texts written for a particular purpose. While NMT systems can be adapted for better translation quality in a target domain given a representative train corpus, this technique has adverse side-effects, including brittleness against out-of-domain examples and "catastrophic forgetting" of previous domains represented in the train data. Moreover, one translation system must cope with many possible domains in real applications, making the "one domain one model" impractical. A promising solution is to build multi-domain NMT systems trained from many domains and adapted to multiple target domains. The rationale behind this is twofold. First, large train corpora improve the generalization of the NMT system. Secondly, texts from one domain can be valuable for adapting an NMT model to a similar domain. The scarcity of data and the hypothetical positive transfer effect are also two main reasons for building multilingual NMT systems. Maintaining multiple bilingual MT systems requires lots of hardware resources as the number of language pairs grows quadratically with the increasing number of languages. Both multi-domain and multilingual NMT systems are essential for saving resources for the MT industry and improving the quality of the MT service. This thesis first unifies domain adaptation and multi-domain adaptation in one mathematical framework. In addition, we review the literature of (multi-)domain adaptation through a structural approach by pointing out four principal cases and matching previous methods to each application case. Secondly, we propose a novel multi-criteria evaluation of multi-domain approaches. We point out the requirements for a multi-domain system and perform an exhaustive comparison of a large set of methods. We also propose new methods for multi-domain adaptation, including sparse word embeddings, sparse layers, and gated residual adapters, which are cheap and able to handle many domains. To balance the heterogeneity in the train data, we explore and study techniques relating to dynamic data sampling, which iteratively adapt the train distribution to a pre-determined testing distribution. Finally, we are interested in context augmented translation approaches, which reuse similar translation memories to improve the prediction of a sentence. We carefully analyze and compare several methods in this line and demonstrate that they are suitable for adapting our NMT system to an unknown domain at the expense of additional computational costs. ; Aujourd'hui, les systèmes de traduction automatique neuronale (NMT) constituent des systèmes de pointe en traduction automatique (TA). Cependant, ces modèles de traduction nécessitent des données d'entraînement relativement volumineuses et ont de la difficulté à traduire des textes de domaine spécifique. Un domaine peut être constitué de textes d'un sujet particulier ou de textes écrits dans un but particulier. Bien que les systèmes NMT puissent être adaptés pour une meilleure qualité de traduction dans un domaine cible étant donné un corpus de train représentatif, cette technique a des effets secondaires négatifs, notamment une fragilité contre des exemples hors domaine et un « oubli catastrophique » des domaines précédents représentés dans les données d'entraînement. De plus, un système de traduction doit faire face à de nombreux domaines possibles dans des applications réelles, ce qui rend impraticable le « un domaine un modèle ». Une solution prometteuse consiste à construire des systèmes NMT multi-domaines formés à partir des données de nombreux domaines et adaptés à plusieurs domaines cibles. Il y a deux motivations. Premièrement, les grands corpus de trains améliorent la généralisation du système NMT. Deuxièmement, les textes d'un domaine peuvent être utiles pour adapter un modèle NMT à un domaine similaire. La pénurie des données et l'effet de transfert positif hypothétique sont également deux raisons principales pour le développement des systèmes NMT multilingues. Maintenir plusieurs systèmes de traduction automatique bilingues nécessite de nombreuses ressources matérielles, car le nombre de paires de langues augmente de façon quadratique avec l'augmentation du nombre de langues. Les systèmes NMT multi-domaines et multilingues sont essentiels pour économiser des ressources pour l'industrie TA et améliorer la qualité du service TA. Cette thèse unifie d'abord l'adaptation de domaine et l'adaptation multi-domaine dans un cadre mathématique. De plus, nous passons en revue la littérature sur l'adaptation aux (multi-)domaines à travers une approche structurelle en montrant quatre cas principaux et en associant les méthodes proposées à chaque cas d'application. Deuxièmement, nous proposons une nouvelle évaluation multicritères des approches multi-domaines. Nous soulignons les exigences d'un système multi-domaines et réalisions une comparaison exhaustive d'un large ensemble de méthodes. Nous proposons également de nouvelles méthodes pour l'adaptation aux multi-domaines, y compris les plongements de mot parcimonieux, les couches parcimonieux et les adaptateurs résiduels, qui sont relativement légers et capables d'adapter un NMT modèle aux nombreux domaines. Pour équilibrer l'hétérogénéité des données d'entraînement, nous explorons et étudions les techniques à l'échantillonnage dynamique des données, qui adaptent de manière itérative la distribution de l'entraînement à une distribution de test prédéterminée. Enfin, nous nous intéressons aux approches de traduction avec des contextes augmentés, qui réutilisent des mémoires de traduction similaires pour améliorer la prédiction d'une phrase. Nous analysons et comparons plusieurs méthodes de cette ligne et démontrons qu'elles conviennent pour adapter notre système NMT à un domaine inconnu au détriment de coûts de calcul supplémentaires.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]; Adaptation au domaine; Apprentissage multi-tâche (MTL); Domain adaptation; Multi-task learning (MTL); Neural machine translation (NMT); Traduction neuronale (NMT)
URL: https://tel.archives-ouvertes.fr/tel-03546910/file/105007_PHAM_2021_archivage.pdf
https://tel.archives-ouvertes.fr/tel-03546910/document
https://tel.archives-ouvertes.fr/tel-03546910
BASE
Hide details

Page: 1 2 3 4 5...45

Catalogues
2
1
0
0
0
0
0
Bibliographies
3
0
0
0
0
0
0
0
1
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
878
2
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern