41 |
Representation learning of writing style, application to news recommendation ; Apprentissage de la représentation du style écrit, application à la recommandation d’articles d’actualité
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-03420487 ; Apprentissage [cs.LG]. Université Paris-Saclay, 2021. Français. ⟨NNT : 2021UPASG010⟩ (2021)
|
|
BASE
|
|
Show details
|
|
42 |
Multi-domain Neural Machine Translation ; Traduction automatique neuronale multidomaine
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-03546910 ; Artificial Intelligence [cs.AI]. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG109⟩ (2021)
|
|
BASE
|
|
Show details
|
|
43 |
The Reading Machine: a Versatile Framework for Studying Incremental Parsing Strategies
|
|
|
|
In: The 17th International Conference on Parsing Technologies ; https://hal.archives-ouvertes.fr/hal-03328439 ; The 17th International Conference on Parsing Technologies, Aug 2021, Bangkok (virtual), Thailand (2021)
|
|
BASE
|
|
Show details
|
|
44 |
Privacy and utility of x-vector based speaker anonymization
|
|
|
|
In: https://hal.inria.fr/hal-03197376 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
45 |
Multilingual Epidemic Event Extraction
|
|
|
|
In: Towards Open and Trustworthy Digital Societies. 23rd International Conference on Asia-Pacific Digital Libraries, ICADL 2021, Virtual Event, December 1–3, 2021, Proceedings ; https://hal.archives-ouvertes.fr/hal-03480551 ; Hao-Ren Ke; Chei Sian Lee; Kazunari Sugiyama. Towards Open and Trustworthy Digital Societies. 23rd International Conference on Asia-Pacific Digital Libraries, ICADL 2021, Virtual Event, December 1–3, 2021, Proceedings, 13133, Springer, pp.139-156, 2021, Lecture Notes in Computer Science, 978-3-030-91668-8. ⟨10.1007/978-3-030-91669-5_12⟩ (2021)
|
|
BASE
|
|
Show details
|
|
46 |
On the Transferability of Neural Models of Morphological Analogies
|
|
|
|
In: AIMLAI, ECML PKDD 2021: European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases ; https://hal.inria.fr/hal-03313591 ; AIMLAI, ECML PKDD 2021: European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2021, Bilbao/Virtual, Spain ; https://2021.ecmlpkdd.org/ (2021)
|
|
BASE
|
|
Show details
|
|
47 |
Étude comparative de méthodes de classification multilingue appliquées à l'épidémiologie
|
|
|
|
In: COnférence en Recherche d'Informations et Applications - CORIA 2021, French Information Retrieval Conference ; https://hal.archives-ouvertes.fr/hal-03320343 ; COnférence en Recherche d'Informations et Applications - CORIA 2021, French Information Retrieval Conference, Apr 2021, Grenoble (virtuel), France (2021)
|
|
BASE
|
|
Show details
|
|
48 |
Enhancing Speech Privacy with Slicing
|
|
|
|
In: https://hal.inria.fr/hal-03369137 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
49 |
Overview of LifeCLEF 2021: an evaluation of Machine-Learning based Species Identification and Species Distribution Prediction
|
|
|
|
In: Experimental IR Meets Multilinguality, Multimodality, and Interaction ; https://hal.inria.fr/hal-03415990 ; K. Selçuk Candan; Bogdan Ionescu; Lorraine Goeuriot; Birger Larsen; Henning Müller; Alexis Joly; Maria Maistro; Florina Piroi; Guglielmo Faggioli; Nicola Ferro. Experimental IR Meets Multilinguality, Multimodality, and Interaction, 12880, Springer International Publishing, pp.371-393, 2021, Lecture Notes in Computer Science, ⟨10.1007/978-3-030-85251-1_24⟩ (2021)
|
|
BASE
|
|
Show details
|
|
50 |
Training RNN Language Models on Uncertain ASR Hypotheses in Limited Data Scenarios
|
|
|
|
In: https://hal.inria.fr/hal-03327306 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
51 |
A Multilingual Dataset for Named Entity Recognition, Entity Linking and Stance Detection in Historical Newspapers
|
|
|
|
In: SIGIR '21: The 44th International ACM SIGIR Conference on Research and Development in Information Retrieval ; https://hal.archives-ouvertes.fr/hal-03418387 ; SIGIR '21: The 44th International ACM SIGIR Conference on Research and Development in Information Retrieval, Jul 2021, Virtual Event, Canada. pp.2328-2334, ⟨10.1145/3404835.3463255⟩ (2021)
|
|
BASE
|
|
Show details
|
|
52 |
D-Cliques: Compensating for Data Heterogeneity with Topology in Decentralized Federated Learning
|
|
|
|
In: https://hal.inria.fr/hal-03498160 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
53 |
Adapting Language Models When Training on Privacy-Transformed Data
|
|
|
|
In: INTERSPEECH 2021 ; https://hal.inria.fr/hal-03189354 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
54 |
Privacy and utility of x-vector based speaker anonymization
|
|
|
|
In: https://hal.inria.fr/hal-03197376 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
55 |
Emerging linguistic universals in communicating neural network agents ; Les universaux linguistiques émergeant dans les réseaux de neurones communicants
|
|
|
|
In: https://hal.inria.fr/tel-03536320 ; Cognitive science. Ecole doctorale cerveau-cognition comportement (ED3C), 2021. English (2021)
|
|
BASE
|
|
Show details
|
|
56 |
Multimodal Coarticulation Modeling : Towards the animation of an intelligible talking head ; Modélisation de la coarticulation multimodale : vers l'animation d'une tête parlante intelligible
|
|
|
|
In: https://hal.univ-lorraine.fr/tel-03203815 ; Intelligence artificielle [cs.AI]. Université de Lorraine, 2021. Français. ⟨NNT : 2021LORR0019⟩ (2021)
|
|
BASE
|
|
Show details
|
|
57 |
Discovering Acoustic Units from Speech: A Bayesian Approach ; Découverte d'unités acoustiques dans la parole : une approche Bayésienne
|
|
|
|
In: https://hal.archives-ouvertes.fr/tel-03478075 ; Computation and Language [cs.CL]. Brno University of Technology (MAIS), 2021. English (2021)
|
|
Abstract:
Dès leur plus jeune age, les enfants montrent une capacité innée d’apprendre les structures linguistiques du signal de la parole, bien avant de savoir lire et écrire. A l’inverse, les systèmes de reconnaissance vocale nécessitent de large ensembles de données préalablement transcrits pour atteindre un faible taux d’erreur. Le champ de recherche relativement récent de « l’apprentissage de la parole de manière non-supervisée » s’efforce de donner aux machines des capacités d’apprentissages similaires. Cette thèse s’inscrit dans cet effort de recherche et se concentre sur leproblème d’apprendre un ensemble d’unités acoustiques pour une langue à partir enregistrements audios non-transcrits. Plus particulièrement, nous explorons le potentiel de « l’inférence bayésienne » pour cette tâche.Dans une première partie, nous revisitons le modèle bayésien non-paramétrique de l’état de l’art et nous proposons un algorithme d’apprentissage efficace d’inférence variationnelle bayésienne. Notre approche se base sur la construction du processus de Dirichlet à partir du « découpage de bâton » qui permet de représenter le modèle comme un modèle de Markov caché de type « boucle phonétique ». Avec ce modèle et l’utilisation de l’approximation des champs moyens de la distribution à posteriori, l’apprentissage s’apparente à un algorithme d’espérance-maximisation. Lesrésultats montrent que cette approche obtient un meilleur clustering que le modèle original tout en étant bien plus rapide. Dans une deuxième partie, nous nous attelons à la tâche de correctement définir une distribution a priori sur les possibles unités acoustiques. Pour arriver à nos fins, nous présentons le concept de modèle de sous-espaces généralisés, un cadre théorique qui nous permet de définir des distributions plongées dans des variétés de petites dimensions. Avec cet outil, nous apprenons un sous-espace phonétique – un continuum de plongement phonétique – à partir d‘enregistrements transcrits dans plusieurs langues. Ensuite, le sous-espace est utilisé pour contraindre notre système pour apprendredes unités acoustiques qui sont similaires aux phones des autres langues. Les résultatsexpérimentaux montrent que cette approche améliore de manière significative la qualité du clustering et la la précision de la segmentation. Finalement, nous améliorons notre système d’extraction d’unités acoustiques en utilisant un processus de Dirichlet hiérarchique au lieu d’un processus de Dirichlet classique. En faisant cela, nous introduisons un modèle le langue phonotactique bayésien dans notre système. Cette approche capture de manière plus fine la structure phonétique de la langue cible et, par voie de conséquence, améliore le clustering du signal de la parole. Aussi, afin de mieux exploiter le modèle de langue phonotactique, nous proposons un algorithme d’inférence variationnelle bayésienne qui peut pondérer le rôle du modèle acoustique et du modèle de langue pendant l’apprentissage. ; From an early age, infants show an innate ability to infer linguistic structures fromthe speech signal long before they learn to read and write. In contrast, modern speechrecognition systems require large collections of transcribed data to achieve a low error rate. The relatively recent field of Unsupervised Speech Learning has been dedicated to endow machines with a similar ability. As a part of this ongoing effort, this thesis focuses on the problem of discovering a set of acoustic units from a language given untranscribed audio recordings. Particularly, we explore the potential of Bayesian inference to address this problem.First, we revisit the state-of-the-art non-parametric Bayesian model for the task of acoustic unit discovery and derive a fast and efficient Variational Bayes inference algorithm. Our approach relies on the stick-breaking construction of the Dirichlet Process which allows expressing the model as a Hidden Markov Model-based phone-loop. With this model and a suitable mean-field approximation of the variational posterior, the inference is made with an efficient iterative algorithm similar to the Expectation-Maximization scheme. Experiments show that this approach performs a better clustering than the original model while being orders of magnitude faster.Secondly, we address the problem of defining a meaningful a priori distribution overthe potential acoustic units. To do so, we introduce the Generalized Subspace Model, atheoretical framework that allows defining distributions over low-dimensional manifoldsin high-dimensional parameter space. Using this tool, we learn a phonetic subspace—a continuum of phone embeddings—from several languages with transcribed recordings.Then, this phonetic subspace is used to constrain our system to discover acoustic units that are similar to phones from other languages. Experimental results show that this approach significantly improves the clustering quality as well as the segmentation accuracy of the acoustic unit discovery system.Finally, we enhance our acoustic units discovery model by using a Hierarchical DirichletProcess prior instead of the simple Dirichlet Process. By doing so, we introduce a Bayesian bigram phonotactic language model to the acoustic unit discovery system. This approach captures more accurately the phonetic structure of the target language and consequently helps the clustering of the speech signal. Also, to fully exploit the benefits of the phonotactic language model, we derive a modified Variational Bayes algorithm that can balance the preponderance of the role of the acoustic and language model during inference.
|
|
Keyword:
[INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-LG]Computer Science [cs]/Machine Learning [cs.LG]; Acoustic unit discovery; Decouverte d'unités acoustiques; Generalized subspace model; Modèle bayésien non-paramétrique; Modèle de sous-espace généralisé; Non-parametric Bayesian model
|
|
URL: https://hal.archives-ouvertes.fr/tel-03478075
|
|
BASE
|
|
Hide details
|
|
58 |
Non-Parametric Bayesian Subspace Models for Acoustic Unit Discovery
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03467205 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
59 |
Analyse des performances des algorithmes d'estimation de la fréquence fondamentale dans le cadre de la voix pathologique
|
|
|
|
In: Séminaire AFCP 2021 – Phonétique Clinique ; https://hal-univ-tlse3.archives-ouvertes.fr/hal-03269235 ; Séminaire AFCP 2021 – Phonétique Clinique, May 2021, Toulouse (virtuel), France ; http://www.afcp-parole.org/seminaire-afcp-phonetique-clinique-27-mai-2021/ (2021)
|
|
BASE
|
|
Show details
|
|
60 |
L'identification automatique des différents bruits de gorge chez le sujet sain : une étude pilote
|
|
|
|
In: Séminaire AFCP 2021 – Phonétique Clinique ; https://hal-univ-tlse3.archives-ouvertes.fr/hal-03269247 ; Séminaire AFCP 2021 – Phonétique Clinique, May 2021, Toulouse (virtuel), France ; http://www.afcp-parole.org/seminaire-afcp-phonetique-clinique-27-mai-2021/ (2021)
|
|
BASE
|
|
Show details
|
|
|
|