2 |
Conceptualising Academic and Folk Understandings of Culture: An Auckland-Based Survey
|
|
|
|
BASE
|
|
Show details
|
|
3 |
ANALYSE DIACHRONIQUE DU PROCESSUS DE DETERMINOLOGISATION Une réflexion en diachronie courte en physique des particules .
|
|
|
|
In: ISSN: 0007-9871 ; EISSN: 2262-0346 ; Cahiers de Lexicologie ; https://halshs.archives-ouvertes.fr/halshs-03344283 ; Cahiers de Lexicologie, Centre National de la Recherche Scientifique, 2021, ⟨10.48611/isbn.978-2-406-12006-3.p.0193⟩ (2021)
|
|
BASE
|
|
Show details
|
|
4 |
Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d'une exploitation textométrique : le cas des interrogatives partielles dans ESLO
|
|
|
|
In: Corpus ; https://halshs.archives-ouvertes.fr/halshs-03133017 ; Corpus, 2021 (2021)
|
|
BASE
|
|
Show details
|
|
5 |
Analyse diachronique du processus de déterminologisation. Une réflexion en diachronie courte en physique des particules
|
|
|
|
In: ISSN: 0007-9871 ; EISSN: 2262-0346 ; Cahiers de Lexicologie ; https://halshs.archives-ouvertes.fr/halshs-03258404 ; Cahiers de Lexicologie, Centre National de la Recherche Scientifique, 2021, 118 (1), ⟨10.48611/isbn.978-2-406-12006-3.p.0193⟩ (2021)
|
|
BASE
|
|
Show details
|
|
6 |
Analyse diachronique du processus de déterminologisation. Une réflexion en diachronie courte en physique des particules
|
|
|
|
In: ISSN: 0007-9871 ; EISSN: 2262-0346 ; Cahiers de Lexicologie ; https://halshs.archives-ouvertes.fr/halshs-03480720 ; Cahiers de Lexicologie, Centre National de la Recherche Scientifique, 2021 (2021)
|
|
BASE
|
|
Show details
|
|
7 |
French spoken from situation to situation ; Le français parlé de situation en situation
|
|
|
|
In: ECODIC : Corpus et didactique, première école d'été sur l'exploitation didactique des corpus oraux ; https://hal.archives-ouvertes.fr/hal-03350269 ; ECODIC : Corpus et didactique, première école d'été sur l'exploitation didactique des corpus oraux, Virginie André, Maud Ciekanski et Carole Etienne, Aug 2021, Nancy, France ; https://corpusdidac.event.univ-lorraine.fr/ (2021)
|
|
BASE
|
|
Show details
|
|
8 |
DELA Corpus - A Document-Level Corpus Annotated with Context-Related Issues
|
|
|
|
In: Castilho, Sheila orcid:0000-0002-8416-6555 , Cavalheiro Camargo, João Lucas orcid:0000-0003-3746-1225 , Menezes, Miguel and Way, Andy orcid:0000-0001-5736-5930 (2021) DELA Corpus - A Document-Level Corpus Annotated with Context-Related Issues. In: Sixth Conference on Machine Translation (WMT21), 10-11 Nov 2021, Punta Cana, Dominican Republic (Online). ISBN 978-1-954085-94-7 (2021)
|
|
BASE
|
|
Show details
|
|
9 |
La lecture contrôlée et assistée par l’analyse statistique des données textuelles : comment et pourquoi interroger un corpus numérique ?
|
|
|
|
In: ISSN: 0994-6632 ; Le Français dans le monde. Recherches et applications ; https://hal.archives-ouvertes.fr/hal-03143287 ; Le Français dans le monde. Recherches et applications, CLE International / Français dans le monde, 2021, Langue et pratiques numériques: nouveaux repères, nouvelles littératies en didactique des langues, pp.84-100 (2021)
|
|
BASE
|
|
Show details
|
|
10 |
Jira: a Kurdish Speech Recognition System Designing and Building Speech Corpus and Pronunciation Lexicon
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03140680 ; 2021 (2021)
|
|
Abstract:
In this paper, we introduce the first large vocabulary speech recognition system (LVSR) for the Central Kurdish language, named Jira. The Kurdish language is an Indo-European language spoken by more than 30 million people in several countries, but due to the lack of speech and text resources, there is no speech recognition system for this language. To fill this gap, we introduce the first speech corpus and pronunciation lexicon for the Kurdish language. Regarding speech corpus, we designed a sentence collection in which the ratio of di-phones in the collection resembles the real data of the Central Kurdish language. The designed sentences are uttered by 576 speakers in a controlled environment with noise-free microphones (called AsoSoft Speech-Office) and in Telegram social network environment using mobile phones (denoted as AsoSoft Speech-Crowdsourcing), resulted in 43.68 hours of speech. Besides, a test set including 11 different document topics is designed and recorded in two corresponding speech conditions (i.e., Office and Crowdsourcing). Furthermore, a 60K pronunciation lexicon is prepared in this research in which we faced several challenges and proposed solutions for them. The Kurdish language has several dialects and sub-dialects that results in many lexical variations. Our methods for script standardization of lexical variations and automatic pronunciation of the lexicon tokens are presented in detail. To setup the recognition engine, we used the Kaldi toolkit. A statistical tri-gram language model that is extracted from the AsoSoft text corpus is used in the system. Several standard recipes including HMM-based models (i.e., mono, tri1, tr2, tri2, tri3), SGMM, and DNN methods are used to generate the acoustic model. These methods are trained with AsoSoft Speech-Office and AsoSoft Speech-Crowdsourcing and a combination of them. The best performance achieved by the SGMM acoustic model which results in 13.9% of the average word error rate (on different document topics) and 4.9% for the general topic.
|
|
Keyword:
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [SCCO.LING]Cognitive science/Linguistics; Jira; Kurdish Language; Pronunciation Lexicon; Speech Corpus; Speech Recognition
|
|
URL: https://hal.archives-ouvertes.fr/hal-03140680/file/Jira%20a%20Kurdish%20Speech%20Recognition%20System.pdf https://hal.archives-ouvertes.fr/hal-03140680/document https://hal.archives-ouvertes.fr/hal-03140680
|
|
BASE
|
|
Hide details
|
|
11 |
Des corpus numériques à l’analyse linguistique en langues de spécialité
|
|
|
|
In: https://hal-univ-paris.archives-ouvertes.fr/hal-03167849 ; Editions Université Grenoble-Alpes (UGA), Collection « Langues, gestes, parole ». 2021, Elisabetta Carpitelli et Jean Marc Colletta ; https://www.uga-editions.com (2021)
|
|
BASE
|
|
Show details
|
|
12 |
Extraire des patterns pour améliorer l'idiomaticité de résumés semi-automatiques en finances : le cas du lexique support
|
|
|
|
In: ToTh2020 - Terminologie & Ontologie : théories et applications ; https://hal.archives-ouvertes.fr/hal-03261533 ; Christophe Roche. ToTh2020 - Terminologie & Ontologie : théories et applications, Presses Universitaires Savoie Mont-Blanc, pp.113-135, 2021, ToTh2020 - Terminologie & Ontologie : théories et applications, 9782377410651 (2021)
|
|
BASE
|
|
Show details
|
|
13 |
Impact of textual data augmentation on linguistic pattern extraction to improve the idiomaticity of extractive summaries
|
|
|
|
In: Lecture Notes in Computer Science ; https://hal.archives-ouvertes.fr/hal-03271380 ; Matteo Golfarelli; Robert Wrembel. Lecture Notes in Computer Science, Springer, In press, Lecture Notes in Computer Science (2021)
|
|
BASE
|
|
Show details
|
|
14 |
When interactions come into the French as a Foreign Language classroom . ; Quand les interactions s'invitent en classe de Français Langue Etrangère .
|
|
|
|
In: AFLS Colloque annuel 2020-21 Le français d'aujourd'hui, entre discours et usage ; https://hal.archives-ouvertes.fr/hal-03349787 ; AFLS Colloque annuel 2020-21 Le français d'aujourd'hui, entre discours et usage, Martin Howard, Dalila Ayoun et Jonathan Kasstan de l'AFLS, Jun 2021, En ligne, Royaume-Uni ; https://sites.google.com/view/afls2021conference/ (2021)
|
|
BASE
|
|
Show details
|
|
15 |
Uncovering Machine Translationese Using Corpus Analysis Techniques to Distinguish between Original and Machine-Translated French
|
|
|
|
In: ISSN: 1027-8559 ; Translation Quarterly ; https://hal.archives-ouvertes.fr/hal-03406287 ; Translation Quarterly, The Hong Kong Translation Society, 2021, pp.21-45 (2021)
|
|
BASE
|
|
Show details
|
|
16 |
Intelligence artificielle et discours politique. Quelles plus-values interprétatives ? Application aux corpus parlementaire et présidentiel contemporains
|
|
|
|
In: L'intelligence artificielle des textes. Des algorithmes à l'interprétation ; https://hal.archives-ouvertes.fr/hal-03347997 ; L'intelligence artificielle des textes. Des algorithmes à l'interprétation, 17, Honoré Champion, pp.131-182, 2021, Lettres numériques, 9782815937467 (2021)
|
|
BASE
|
|
Show details
|
|
17 |
Stratégies de communication en FLE. Création et exploitation d’un corpus oral longitudinal d’apprenants en immersion.
|
|
|
|
In: XXIX Colloque de l’AFUE. Transfrontalier·e·s : Le français langue de rencontre(s). ; https://hal.archives-ouvertes.fr/hal-03630211 ; XXIX Colloque de l’AFUE. Transfrontalier·e·s : Le français langue de rencontre(s)., AFUE (Asociación de Francesistas de la Universidad Española). UPV/EHU., Nov 2021, Vitoria-Gasteiz, Espagne ; https://www.ehu.eus/es/web/afue2020 (2021)
|
|
BASE
|
|
Show details
|
|
18 |
Semantic neology through phraseological calque ; La néologie sémantique par calque phraséologique
|
|
|
|
In: La néologie des langues romanes : Nouvelles approches, dynamiques et enjeux ; https://hal.archives-ouvertes.fr/hal-03353015 ; La néologie des langues romanes : Nouvelles approches, dynamiques et enjeux, 2021 (2021)
|
|
BASE
|
|
Show details
|
|
19 |
Louis Meigret et la réutilisabilité des données
|
|
|
|
In: 10 ans avec CAHIER. Des corpus d'auteurs pour les humanités à leur exploitation numérique ; https://hal.archives-ouvertes.fr/hal-03525241 ; 10 ans avec CAHIER. Des corpus d'auteurs pour les humanités à leur exploitation numérique, Jun 2021, Bordeaux, France (2021)
|
|
BASE
|
|
Show details
|
|
20 |
Exprimer le futur en interaction: caractéristiques et enseignement en classe de FLE ; : Expressing the future in interaction: characteristics and teaching in the FFL classroom
|
|
|
|
In: AFLS Colloque annuel 2020-21 Le français d'aujourd'hui, entre discours et usage ; https://hal.archives-ouvertes.fr/hal-03349799 ; AFLS Colloque annuel 2020-21 Le français d'aujourd'hui, entre discours et usage, AFLS, Jun 2021, En ligne, Royaume-Uni ; https://sites.google.com/view/afls2021conference (2021)
|
|
BASE
|
|
Show details
|
|
|
|