1 |
OOV Proper Name Retrieval using Topic and Lexical Context Model
|
|
|
|
In: IEEE International Conference on Acoustics, Speech and Signal Processing ; https://hal.archives-ouvertes.fr/hal-01184963 ; IEEE International Conference on Acoustics, Speech and Signal Processing, 2015, Brisbane, Australia (2015)
|
|
BASE
|
|
Show details
|
|
2 |
Continuous Word Representation using Neural Networks for Proper Name Retrieval from Diachronic Documents
|
|
|
|
In: Interspeech 2015 ; https://hal.archives-ouvertes.fr/hal-01184951 ; Interspeech 2015, Sep 2015, Dresden, Germany (2015)
|
|
BASE
|
|
Show details
|
|
3 |
Study of Entity-Topic Models for OOV Proper Name Retrieval
|
|
|
|
In: Interspeech 2015 ; https://hal.archives-ouvertes.fr/hal-01184955 ; Interspeech 2015, Sep 2015, Dresden, Germany (2015)
|
|
BASE
|
|
Show details
|
|
4 |
Proper Name Retrieval from Diachronic Documents for Automatic Speech Transcription using Lexical and Temporal Context
|
|
|
|
In: Workshop on Speech, Language and Audio in Multimedia ; https://hal.inria.fr/hal-01092224 ; Workshop on Speech, Language and Audio in Multimedia, Sep 2014, Penang, Malaysia (2014)
|
|
BASE
|
|
Show details
|
|
5 |
Ajout de nouveaux noms propres au vocabulaire d’un système de transcription en utilisant un corpus diachronique
|
|
|
|
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.archives-ouvertes.fr/hal-01184950 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2014, 55 (2), pp.47-72 (2014)
|
|
BASE
|
|
Show details
|
|
6 |
3D Visual Speech Animation from Image Sequences
|
|
|
|
In: Indian Conference on Computer Vision, Graphics and Image Processing (ICVGIP) ; https://hal.archives-ouvertes.fr/hal-01086073 ; Indian Conference on Computer Vision, Graphics and Image Processing (ICVGIP), Dec 2014, Bangalore, India (2014)
|
|
BASE
|
|
Show details
|
|
7 |
CoALT: A Software for Comparing Automatic Labelling Tools
|
|
|
|
In: proceedings of Language Resources and Evaluation LREC ; Language Resources and Evaluation LREC 2012 ; https://hal.archives-ouvertes.fr/hal-00761781 ; Language Resources and Evaluation LREC 2012, May 2012, Istanbul, Turkey. pp.325-328 (2012)
|
|
BASE
|
|
Show details
|
|
8 |
Multilingual Recognition of Non-Native Speech using Acoustic Model Transformation and Pronunciation Modeling
|
|
|
|
In: ISSN: 1381-2416 ; EISSN: 1572-8110 ; International Journal of Speech Technology ; https://hal.archives-ouvertes.fr/hal-00764626 ; International Journal of Speech Technology, Springer Verlag, 2012, 15 (2), pp.203 - 213 (2012)
|
|
BASE
|
|
Show details
|
|
9 |
Impact of Pronunciation Variant Frequency on Automatic Non-Native Speech Segmentation
|
|
|
|
In: Language & Technology Conference - LTC'11 ; 5th Language & Technology Conference - LTC'11 ; https://hal.archives-ouvertes.fr/hal-00639118 ; 5th Language & Technology Conference - LTC'11, Nov 2011, Poznan, Poland. pp.145-148 (2011)
|
|
BASE
|
|
Show details
|
|
10 |
Weight Optimization for Bimodal Unit-Selection Talking Head Synthesis
|
|
|
|
In: 12thAnnual Conference of the International Speech Communication Association - Interspeech 2011 ; https://hal.inria.fr/inria-00602407 ; 12thAnnual Conference of the International Speech Communication Association - Interspeech 2011, Aug 2011, Florence, Italy (2011)
|
|
BASE
|
|
Show details
|
|
11 |
Quelques contributions en reconnaissance automatique de la parole robuste
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-00579816 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2010 (2010)
|
|
BASE
|
|
Show details
|
|
12 |
Metadata for Wicri, a network of semantic Wikis for communities in research and innovation
|
|
|
|
In: International Conference on Dublin Core and Metadata Applications - DC-2010 ; https://hal.inria.fr/inria-00535962 ; International Conference on Dublin Core and Metadata Applications - DC-2010, Oct 2010, Pittsburgh, United States (2010)
|
|
BASE
|
|
Show details
|
|
13 |
Detection of OOV words by combining acoustic confidence measures with linguistic features
|
|
|
|
In: proceedings of Automatic Speech Recognition and Understanding ; The eleventh biannual IEEE workshop on Automatic Speech Recognition and Understanding (ASRU) ; https://hal.archives-ouvertes.fr/hal-00435087 ; The eleventh biannual IEEE workshop on Automatic Speech Recognition and Understanding (ASRU), Dec 2009, Merano, Italy. pp.1-4 (2009)
|
|
BASE
|
|
Show details
|
|
14 |
Acquisition et modélisation de données articulatoires dans un contexte multimodal ; Acquiring and modelling multimodal articulatory data
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-00432124 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy I, 2009. Français (2009)
|
|
Abstract:
There is no single technique that will allow all relevant behaviour of the speech articulators (lips, tongue, palate.) to be spatially ant temporally acquired. Thus, this thesis investigates the fusion of multimodal articulatory data. A framework is described in order to acquire and fuse automatically an important database of articulatory data. This includes: 2D Ultrasound (US) data to recover the dynamic of the tongue, stereovision data to recover the 3D dynamic of the lips, electromagnetic sensors that provide 3D position of points on the face and the tongue, and 3D Magnetic Resonance Imaging (MRI) that depict the vocal tract for various sustained articulations. We investigate the problems of the temporal synchronization and the spatial registration between all these modalities, and also the extraction of the shape articulators from the data (tongue tracking in US images). We evaluate the uncertainty of our system by quantifying the spatial and temporal inacuracies of the components of the system, both individually and in combination. Finally, the fused data are evaluated on an existing articulatory model to assess their quality for an application in speech production. ; La connaissance des positions et des mouvements des articulateurs (lèvres, palais, langue.) du conduit vocal lors de la phonation est un enjeu crucial pour l'étude de la parole. Puisqu'il n'existe pas encore de système permettant l'acquisition de ces positions et de ces mouvements, ce travail de thèse s'intéresse à la fusion de plusieurs modalités d'imagerie et de capteurs de localisation pour l'acquisition des positions des articulateurs dans l'espace et dans le temps. Nous décrivons un ensemble de protocoles et de méthodes pour obtenir et fusionner automatiquement un important volume de données échographiques (imageant en 2D la dynamique de la langue), stéréoscopiques (imageant en 3D la dynamique des lèvres), de capteurs électromagnétiques (capturant des points 3D de la langue et du visage), et d'Imagerie par Résonance Magnétique (IRM) pour acquérir en 3D l'ensemble des articulateurs en position statique. Nos contributions concernent plus particulièrement la synchronisation temporelle, le recalage spatial des données et l'extraction automatique des formes à partir des données (suivi de la langue dans les images échographiques). Nous évaluons la précision sur chaque donnée extraite, ainsi que sur l'ensemble des données fusionnées. Nous les validons enfin sur un modèle articulatoire existant. Ces travaux permettent l'obtention de données bien fondées pour la mise en place et l'étude de modèles articulatoires pour des applications en parole.
|
|
Keyword:
[INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; acquisition and fusion of multimodal articulatory data; acquisition multimodale; articulatory data validation; calibrage échographie mains libres; calibration for freehand 3-D ultrasound system; capteurs électromagnétiques; données articulatoires; échographies; electromagnetic sensors; fusion multimodale; incertitude de recalage; IRM; MRI; recalage multimodal; registration uncertainty; spatial registration; suivi de la langue; synchronisation; synchronization; tongue tracking; ultrasound images; validation de données articulatoires
|
|
URL: https://tel.archives-ouvertes.fr/tel-00432124v2/document https://tel.archives-ouvertes.fr/tel-00432124 https://tel.archives-ouvertes.fr/tel-00432124v2/file/these.pdf
|
|
BASE
|
|
Hide details
|
|
15 |
Intelligent patents analysis using a multiview neural-based approach
|
|
|
|
In: Conference on Recent Trends in Patinformatics ; https://hal.inria.fr/inria-00535934 ; Conference on Recent Trends in Patinformatics, Dec 2009, Puna, India (2009)
|
|
BASE
|
|
Show details
|
|
16 |
Acoustic-to-articulatory inversion with constraints ; Inversion acoustique-articulatoire avec contraintes
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01748423 ; Interface homme-machine [cs.HC]. Université Henri Poincaré - Nancy 1, 2008. Français. ⟨NNT : 2008NAN10085⟩ (2008)
|
|
BASE
|
|
Show details
|
|
17 |
Text-Independent Foreign Accent Classification Using Statistical Methods
|
|
|
|
In: proceedings of IEEE International Conference on Signal Processing and Communications ; International Conference on Signal Processing and Communications ; https://hal.archives-ouvertes.fr/hal-00163745 ; International Conference on Signal Processing and Communications, Nov 2007, Dubai, United Arab Emirates. pp.4 (2007)
|
|
BASE
|
|
Show details
|
|
18 |
Coordination in Interaction Grammars ; La coordination dans les grammaires d'interaction
|
|
|
|
In: https://tel.archives-ouvertes.fr/tel-01752899 ; Génie logiciel [cs.SE]. Institut National Polytechnique de Lorraine - INPL, 2007. Français. ⟨NNT : 2007INPL063N⟩ (2007)
|
|
BASE
|
|
Show details
|
|
19 |
Tools devoted to the acquisition of the prosody of a foreign language
|
|
|
|
In: International Congress of Phonetic Sciences - ICPhS 2007 ; https://hal.inria.fr/inria-00184530 ; International Congress of Phonetic Sciences - ICPhS 2007, Aug 2007, Saarbrücken, Germany. pp.1593-1596 (2007)
|
|
BASE
|
|
Show details
|
|
20 |
A phonetic concatenative approach of labial coarticulation
|
|
|
|
In: INTERSPEECH 2007 ; https://hal.inria.fr/inria-00184252 ; INTERSPEECH 2007, ISCA, Aug 2007, Antwerp, Belgium. pp.1402-1405 (2007)
|
|
BASE
|
|
Show details
|
|
|
|