DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...10
Hits 1 – 20 of 188

1
Unsupervised Word embedding Alignment in the biomedical domain ; Alignement non supervisé d'embeddings de mots dans le domaine biomédical
In: CIFSD - Conférence Internationale Francophone sur la Science des Données ; https://hal.archives-ouvertes.fr/hal-03259987 ; CIFSD - Conférence Internationale Francophone sur la Science des Données, Jun 2021, Marseille/Virtuel, France (2021)
BASE
Show details
2
Models of diachronic semantic change using word embeddings ; Modèles diachroniques à base de plongements de mot pour l'analyse du changement sémantique
Montariol, Syrielle. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03199801 ; Document and Text Processing. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG006⟩ (2021)
Abstract: In this thesis, we study lexical semantic change: temporal variations in the use and meaning of words, also called extit{diachrony}. These changes are carried by the way people use words, and mirror the evolution of various aspects of society such as its technological and cultural environment.We explore, compare and evaluate methods to build time-varying embeddings from a corpus in order to analyse language evolution.We focus on contextualised word embeddings using pre-trained language models such as BERT. We propose several approaches to extract and aggregate the contextualised representations of words over time, and quantify their level of semantic change.In particular, we address the practical aspect of these systems: the scalability of our approaches, with a view to applying them to large corpora or large vocabularies; their interpretability, by disambiguating the different uses of a word over time; and their applicability to concrete issues, for documents related to COVID19We evaluate the efficiency of these methods quantitatively using several annotated corpora, and qualitatively by linking the detected semantic variations with real-life events and numerical data.Finally, we extend the task of semantic change detection beyond the temporal dimension. We adapt it to a bilingual setting, to study the joint evolution of a word and its translation in two corpora of different languages; and to a synchronic frame, to detect semantic variations across different sources or communities on top of the temporal variation. ; Dans cette thèse, nous étudions les changements lexico-sémantiques : les variations temporelles dans l'usage et la signification des mots, également appelé extit{diachronie}. Ces changements reflètent l'évolution de divers aspects de la société tels que l'environnement technologique et culturel.Nous explorons et évaluons des méthodes de construction de plongements lexicaux variant dans le temps afin d'analyser l'évolution du language. Nous utilisont notamment des plongements contextualisés à partir de modèles de langue pré-entraînés tels que BERT.Nous proposons plusieurs approches pour extraire et agréger les représentations contextualisées des mots dans le temps, et quantifier leur degré de changement sémantique. En particulier, nous abordons l'aspect pratique de ces systèmes: le passage à l'échelle de nos approches, en vue de les appliquer à de grands corpus ou de larges vocabulaire; leur interprétabilité, en désambiguïsant les différents usages d'un mot au cours du temps; et leur applicabilité à des problématiques concrètes, pour des documents liés au COVID19 et des corpus du domaine financier. Nous évaluons l'efficacité de ces méthodes de manière quantitative, en utilisant plusieurs corpus annotés, et de manière qualitative, en liant les variations détectées dans des corpus avec des événements de la vie réelle et des données numériques.Enfin, nous étendons la tâche de détection de changements sémantiques au-delà de la dimension temporelle. Nous l'adaptons à un cadre bilingue, pour étudier l'évolution conjointe d'un mot et sa traduction dans deux corpus de langues différentes; et à un cadre synchronique, pour détecter des variations sémantiques entre différentes sources ou communautés en plus de la variation temporelle.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; Changement sémantique; Diachronie; Diachrony; Domaine financier; Financial domain; Language models; Modèles de langue; Multilingual; Multilingue; Plongements de mot; Semantic change; Word embeddings
URL: https://tel.archives-ouvertes.fr/tel-03199801/document
https://tel.archives-ouvertes.fr/tel-03199801
https://tel.archives-ouvertes.fr/tel-03199801/file/98864_MONTARIOL_2021_archivage.pdf
BASE
Hide details
3
Multilingual neural architectures for natural language processing ; Architectures neuronales multilingues pour le traitement automatique des langues naturelles
Bardet, Adrien. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03199494 ; Informatique et langage [cs.CL]. Université du Maine, 2021. Français. ⟨NNT : 2021LEMA1002⟩ (2021)
BASE
Show details
4
Écrire en langues. Entre traduction automatique et hégémonie globish, le multilinguisme comme horizon réaliste pour les revues de SHS
In: ISSN: 2490-9424 ; Biens Symboliques = Symbolic Goods ; https://halshs.archives-ouvertes.fr/halshs-03481421 ; Biens Symboliques = Symbolic Goods, Presses Universitaires de Vincennes, A paraître (2021)
BASE
Show details
5
Extraction and normalization of simple and structured entities in medical documents ; Extraction et normalisation d'entités simples et structurées dans les documents médicaux
Wajsbürt, Perceval. - : HAL CCSD, 2021
In: https://hal.archives-ouvertes.fr/tel-03624928 ; Document and Text Processing. Sorbonne Université, 2021. English (2021)
BASE
Show details
6
Automatic sentence simplification using controllable and unsupervised methods ; Simplification automatique de phrases à l'aide de méthodes contrôlables et non supervisées
Martin, Louis. - : HAL CCSD, 2021
In: https://tel.archives-ouvertes.fr/tel-03543971 ; Computation and Language [cs.CL]. Sorbonne Université, 2021. English. ⟨NNT : 2021SORUS265⟩ (2021)
BASE
Show details
7
Graph Algorithms for Multiparallel Word Alignment
In: Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing ; The 2021 Conference on Empirical Methods in Natural Language Processing ; https://hal.archives-ouvertes.fr/hal-03424044 ; The 2021 Conference on Empirical Methods in Natural Language Processing, Association for Computational Linguistics, Nov 2021, Punta Cana, Dominica ; https://2021.emnlp.org/ (2021)
BASE
Show details
8
Au cœur de la terminologie du jeu vidéo. L’absence de ressources, frein majeur pour les traducteurs
In: ISSN: 0395-773X ; EISSN: 2272-9992 ; Traduire ; https://hal.archives-ouvertes.fr/hal-03465992 ; Traduire, Société française des traducteurs, 2021, Des jeux et des mots (2021)
BASE
Show details
9
Modéliser la perception des genres musicaux à travers différentes cultures à partir de ressources linguistiques
In: Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale ; Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-03265881 ; Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.270-272 (2021)
BASE
Show details
10
A Lexico-phonetic Comparison of Olukumi and Lukumi: A Procedure for Developing a Multilingual Dictionary
In: Lexikos; Vol. 31 (2021); 214-233 ; 2224-0039 (2021)
BASE
Show details
11
La ressource FAIRterm : entre pratique pédagogique et professionnalisation en traduction spécialisée ...
Vezzani, Federica. - : Zenodo, 2021
BASE
Show details
12
La ressource FAIRterm : entre pratique pédagogique et professionnalisation en traduction spécialisée ...
Vezzani, Federica. - : Zenodo, 2021
BASE
Show details
13
Traduire le droit international pénal ... : Du concept international de génocide à ses définitions nationales ...
Girard, Marie-Hélène. - : Classiques Garnier, 2021
BASE
Show details
14
Une typologie revisitée de la synonymie ...
Alipour, Marjan; L'Homme, Marie-Claude. - : Classiques Garnier, 2021
BASE
Show details
15
Les possibilités de DiCoEnviro en version frames comme ressource pour la traduction ...
Ortego-Antón, María-Teresa. - : Classiques Garnier, 2021
BASE
Show details
16
Criação de narrativas multilineares como ferramenta de aprendizagem das línguas estrangeiras no ensino superior em Portugal
Delplancq, Véronique; Costa Lopes, Ana Maria; Costa, Cristina Amaro. - : Universidade do Minho. Instituto de Educação. Centro de Investigação em Educação, 2021
BASE
Show details
17
Cross language plagiarism detection with contextualized word embeddings ; Detecção de plágio multilíngue usando word embeddings contextualizadas
BASE
Show details
18
A vertente turística da tradução e da comunicação multilingue: o caso do Posto de Turismo de Braga
BASE
Show details
19
Le identità multiple delle famiglie multilingue: processi sottesi tra linguaggio e identità culturale
Elisabetta Di Giovanni; Gaetano Di Napoli. - : country:IT, 2021
BASE
Show details
20
Le projet HYPAquitaine : une innovation disruptive?
In: Journée d’étude : Les Humanités numériques : une transdiscipline historique ; https://hal.archives-ouvertes.fr/hal-03140701 ; Journée d’étude : Les Humanités numériques : une transdiscipline historique, Université de La Rochelle, Nov 2020, La Rochelle, France (2020)
BASE
Show details

Page: 1 2 3 4 5...10

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
188
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern