DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...329
Hits 1 – 20 of 6.577

1
Computational models of disfluencies : fillers and discourse markers in spoken language understanding ; Modèles computationnels des disfluences dans le traitement de la parole
Dinkar, Tanvi. - : HAL CCSD, 2022
In: https://tel.archives-ouvertes.fr/tel-03653211 ; Computer science. Institut Polytechnique de Paris, 2022. English. ⟨NNT : 2022IPPAT001⟩ (2022)
Abstract: People rarely speak in the same manner that they write – they are generally disfluent. Disfluencies can be defined as interruptions in the regular flow of speech, such as pausing silently, repeating words, or interrupting oneself to correct something said previously. Despite being a natural characteristic of spontaneous speech, and the rich linguistic literature that discusses their informativeness, they are often removed as noise in post-processing from the output transcripts of speech recognisers. So far, their consideration in a Spoken Language Understanding (SLU) context has been rarely explored. The aim of this thesis is to develop computational models of disfluencies in SLU. To do so, we take inspiration from psycholinguistic models of disfluencies, which focus on the role that disfluencies play in the production (by the speaker) and comprehension (by the listener) of speech. Specifically, when we use the term ``computational models of disfluencies'', we mean to develop methodologies that automatically process disfluencies to empirically observe 1) their impact on the production and comprehension of speech, and 2) how they interact with the primary signal (the lexical, or what was said in essence). To do so, we focus on two discourse contexts; monologues and task-oriented dialogues.Our results contribute to broader tasks in SLU, and also research relevant to Spoken Dialogue Systems. When studying monologues, we use a combination of traditional and neural models to study the representations and impact of disfluencies on SLU performance. Additionally, we develop methodologies to study disfluencies as a cue for incoming information in the flow of the discourse. In studying task-oriented dialogues, we focus on developing computational models to study the roles of disfluencies in the listener-speaker dynamic. We specifically study disfluencies in the context of verbal alignment; i.e. the alignment of the interlocutors' lexical expressions, and the role of disfluencies in behavioural alignment; a new alignment context that we propose to mean when instructions given by one interlocutor are followed with an action by another interlocutor. We also consider how these disfluencies in local alignment contexts can be associated with discourse level phenomena; such as success in the task. We consider this thesis one of the many first steps that could be undertaken to integrate disfluencies in SLU contexts. ; Les gens s'expriment rarement de la même manière qu'ils écrivent - en effet ils écrivent rarement de manière diffluente. Les disfluences sont des interruptions dans le flux régulier de la parole, telles que les pauses (silencieuses), les répétitions de mots ou les interruptions pour corriger une phrase précédemment dite. Bien qu'il s'agisse d'une caractéristique naturelle de la parole spontanée et malgré la riche littérature linguistique qui traite de leur caractère informatif, elles sont souvent considérées comme du bruit et éliminées lors du post-traitement des transcriptions de sortie des systèmes de reconnaissance de la parole. Jusqu'à présent, leur prise en compte dans un contexte de compréhension de la langue parlée (CLP) a rarement été explorée. L'objectif de cette thèse est de développer des modèles informatiques des disfluences dans la CLP. Pour ce faire, nous prenons inspirons dans les modèles psycholinguistiques des disfluences, qui se concentrent sur le rôle que les disfluences jouent dans l'expression (par le locuteur) et la compréhension (par l'auditeur) du discours. Plus précisément, lorsque nous utilisons le terme "modèles informatiques des disfluences", nous entendons développer des méthodologies qui traitent automatiquement les disfluences afin d'observer empiriquement 1) leurs impacts sur la production et la compréhension de la parole et 2) leurs interactions avec le signal primaire (lexical, ou la substance du discours). A cet effet, nous nous concentrons sur deux types de discours : les monologues et les dialogues orientés vers une tâche. Nos résultats se concentrent sur des tâches de CLP, ainsi que sur les recherches pertinentes pour les systèmes de dialogues parlés. Lors de l'étude des monologues, nous utilisons une combinaison de modèles traditionnels et neuronaux pour étudier les représentations et l'impact des disfluences sur la performance de le CLP. De plus, nous développons des méthodologies pour étudier les disfluences en tant qu'indices d'informations entrantes dans le flux du discours. Dans l'étude des dialogues orientés vers une tâche, nous nous concentrons sur le développement de modèles informatiques pour étudier les rôles des disfluences dans la dynamique auditeur-locuteur. Nous étudions spécifiquement les disfluences dans le contexte de l'alignement verbal, c'est-à-dire l'alignement des expressions lexicales des interlocuteurs et leurs roles dans l'alignement comportemental, un nouveau contexte d'alignement que nous proposons de définir comme le moment où les instructions données par un interlocuteur sont suivis d'une action par un autre interlocuteur. Nous examinons également comment les disfluences dans les contextes d'alignement locaux peuvent être associées à des phénomènes au niveau du discours, tels que la réussite de la tâche. Nous considérons cette thèse comme l'un des premiers travaux, qui pourrait aboutir à intégration des disfluences dans les contextes d'alignement local.
Keyword: [SCCO.COMP]Cognitive science/Computer science; [SCCO.LING]Cognitive science/Linguistics; Compréhension de la langue parlée (CLP); Discourse marker; Disfluences; Fillers; Human-robot interaction; Interaction homme-robot; Marqueur de discours; Natural language processing (NLP); Remplissage; Spoken language understanding (SLU); Traitement automatique des langues
URL: https://tel.archives-ouvertes.fr/tel-03653211/document
https://tel.archives-ouvertes.fr/tel-03653211/file/101655_DINKAR_2022_archivage.pdf
https://tel.archives-ouvertes.fr/tel-03653211
BASE
Hide details
2
Single-word severity and intelligibility in CAS (Chenausky et al., 2022) ...
BASE
Show details
3
Processing Phonotactic Illegality (Steinberg et al., 2016) ...
BASE
Show details
4
A Mandarin Chinese–Oriented Sound Test (Hung et al., 2016) ...
Hung, Yu-Chen; Lin, Chun-Yi; Tsai, Li-Chiun. - : ASHA journals, 2022
BASE
Show details
5
Processing Phonotactic Illegality (Steinberg et al., 2016) ...
BASE
Show details
6
A Mandarin Chinese–Oriented Sound Test (Hung et al., 2016) ...
Hung, Yu-Chen; Lin, Chun-Yi; Tsai, Li-Chiun. - : ASHA journals, 2022
BASE
Show details
7
On the benefits of speech-language therapy for cleft lip and/or palate (Sand et al., 2022) ...
Sand, Anders; Hagberg, Emilie; Lohmander, Anette. - : ASHA journals, 2022
BASE
Show details
8
On the benefits of speech-language therapy for cleft lip and/or palate (Sand et al., 2022) ...
Sand, Anders; Hagberg, Emilie; Lohmander, Anette. - : ASHA journals, 2022
BASE
Show details
9
Single-word severity and intelligibility in CAS (Chenausky et al., 2022) ...
BASE
Show details
10
Task and language in Spanish–English narratives (Wofford et al., 2022) ...
BASE
Show details
11
Task and language in Spanish–English narratives (Wofford et al., 2022) ...
BASE
Show details
12
Prediction of upcoming pitch accent using Sandhi rules in Kansai Japanese: A web-based visual world eye-tracking study ...
Ito, Aine. - : Open Science Framework, 2022
BASE
Show details
13
Agreement attraction in English and Czech: A direct experimental comparison ...
Lacina, Radim. - : Open Science Framework, 2022
BASE
Show details
14
Attention-Language Interface in Multilingual Assessment Instrument for Narratives (MAIN) ...
Sekerina, Irina. - : Open Science Framework, 2022
BASE
Show details
15
Individual Differences in Word Recognition (McMurray et al., 2014) ...
McMurray, Bob; Munson, Cheyenne; Tomblin, J. Bruce. - : ASHA journals, 2022
BASE
Show details
16
Individual Differences in Word Recognition (McMurray et al., 2014) ...
McMurray, Bob; Munson, Cheyenne; Tomblin, J. Bruce. - : ASHA journals, 2022
BASE
Show details
17
Use of Parsing Heuristics in the Comprehension of Passive Sentences: Evidence from Dyslexia and Individual Differences
In: Brain Sciences; Volume 12; Issue 2; Pages: 209 (2022)
BASE
Show details
18
FedQAS: Privacy-Aware Machine Reading Comprehension with Federated Learning
In: Applied Sciences; Volume 12; Issue 6; Pages: 3130 (2022)
BASE
Show details
19
Literacy Acquisition Trajectories in Bilingual Language Minority Children and Monolingual Peers with Similar or Different SES: A Three-Year Longitudinal Study
In: Brain Sciences; Volume 12; Issue 5; Pages: 563 (2022)
BASE
Show details
20
Language-Internal Reanalysis of Clitic Placement in Heritage Grammars Reduces the Cost of Computation: Evidence from Bulgarian
In: Languages; Volume 7; Issue 1; Pages: 24 (2022)
BASE
Show details

Page: 1 2 3 4 5...329

Catalogues
382
0
991
0
0
3
7
Bibliographies
4.319
4
0
0
0
0
0
1
4
Linked Open Data catalogues
0
Online resources
6
0
0
0
Open access documents
2.235
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern