DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 42

1
On sample efficiency and systematic generalization of grounded language understanding with deep learning
Abstract: En utilisant la méthodologie de l'apprentissage profond qui préconise de s'appuyer davantage sur des données et des modèles neuronaux flexibles plutôt que sur les connaissances de l'expert dans le domaine, la communauté de recherche a récemment réalisé des progrès remarquables dans la compréhension et la génération du langue naturel. Néanmoins, il reste difficile de savoir si une simple extension des méthodes d'apprentissage profond existantes sera suffisante pour atteindre l'objectif d'utiliser le langage naturel pour l'interaction homme-machine. Nous nous concentrons sur deux aspects connexes dans lesquels les méthodes actuelles semblent nécessiter des améliorations majeures. Le premier de ces aspects est l'inefficacité statistique des systèmes d'apprentissage profond: ils sont connus pour nécessiter de grandes quantités de données pour bien fonctionner. Le deuxième aspect est leur capacité limitée à généraliser systématiquement, à savoir à comprendre le langage dans des situations où la distribution des données change mais les principes de syntaxe et de sémantique restent les mêmes. Dans cette thèse, nous présentons quatre études de cas dans lesquelles nous cherchons à apporter plus de clarté concernant l'efficacité statistique susmentionnée et les aspects de généralisation systématique des approches d'apprentissage profond de la compréhension des langues, ainsi qu'à faciliter la poursuite des travaux sur ces sujets. Afin de séparer le problème de la représentation des connaissances du monde réel du problème de l'apprentissage d'une langue, nous menons toutes ces études en utilisant des langages synthétiques ancrés dans des environnements visuels simples. Dans le premier article, nous étudions comment former les agents à suivre des instructions compositionnelles dans des environnements avec une forme de supervision restreinte. À savoir pour chaque instruction et configuration initiale de l'environnement, nous ne fournissons qu'un état cible au lieu d'une trajectoire complète avec des actions à toutes les étapes. Nous adaptons les méthodes d'apprentissage adversariel par imitation à ce paramètre et démontrons qu'une telle forme restreinte de données est suffisante pour apprendre les significations compositionelles des instructions. Notre deuxième article se concentre également sur des agents qui apprennent à exécuter des instructions. Nous développons la plateforme BabyAI pour faciliter des études plus approfondies et plus rigoureuses de ce cadre d'apprentissage. La plateforme fournit une langue BabyAI compositionnelle avec $10 ^ {19}$ instructions, dont la sémantique est précisément définie dans un environnement partiellement observable. Nous rapportons des résultats de référence sur la quantité de supervision nécessaire pour enseigner à l'agent certains sous-ensembles de la langue BabyAI avec différentes méthodes de formation, telles que l'apprentissage par renforcement et l'apprentissage par imitation. Dans le troisième article, nous étudions la généralisation systématique des modèles de réponse visuelle aux questions (VQA). Dans le scénario VQA, le système doit répondre aux questions compositionelles sur les images. Nous construisons un ensemble de données de questions spatiales sur les paires d'objets et évaluons la performance des différents modèles sur les questions concernant les paires d'objets qui ne se sont jamais produites dans la même question dans la distribution d'entraînement. Nous montrons que les modèles dans lesquels les significations des mots sont représentés par des modules séparés qui effectuent des calculs indépendants généralisent beaucoup mieux que les modèles dont la conception n'est pas explicitement modulaire. Cependant, les modèles modulaires ne généralisent bien que lorsque les modules sont connectés dans une disposition appropriée, et nos expériences mettent en évidence les défis de l'apprentissage de la disposition par un apprentissage de bout en bout sur la distribution d'entraînement. Dans notre quatrième et dernier article, nous étudions également la généralisation des modèles VQA à des questions en dehors de la distribution d'entraînement, mais cette fois en utilisant le jeu de données CLEVR, utilisé pour les questions complexes sur des scènes rendues en 3D. Nous générons de nouvelles questions de type CLEVR en utilisant des références basées sur la similitude (par exemple `` la balle qui a la même couleur que . '') dans des contextes qui se produisent dans les questions CLEVR mais uniquement avec des références basées sur la localisation (par exemple `` le balle qui est à gauche de . ''). Nous analysons la généralisation avec zéro ou quelques exemples de CLOSURE après un entraînement sur CLEVR pour un certain nombre de modèles existants ainsi qu'un nouveau modèle. ; By using the methodology of deep learning that advocates relying more on data and flexible neural models rather than on the expert's knowledge of the domain, the research community has recently achieved remarkable progress in natural language understanding and generation. Nevertheless, it remains unclear whether simply scaling up existing deep learning methods will be sufficient to achieve the goal of using natural language for human-computer interaction. We focus on two related aspects in which current methods appear to require major improvements. The first such aspect is the data inefficiency of deep learning systems: they are known to require extreme amounts of data to perform well. The second aspect is their limited ability to generalize systematically, namely to understand language in situations when the data distribution changes yet the principles of syntax and semantics remain the same. In this thesis, we present four case studies in which we seek to provide more clarity regarding the aforementioned data efficiency and systematic generalization aspects of deep learning approaches to language understanding, as well as to facilitate further work on these topics. In order to separate the problem of representing open-ended real-world knowledge from the problem of core language learning, we conduct all these studies using synthetic languages that are grounded in simple visual environments. In the first article, we study how to train agents to follow compositional instructions in environments with a restricted form of supervision. Namely for every instruction and initial environment configuration we only provide a goal-state instead of a complete trajectory with actions at all steps. We adapt adversarial imitation learning methods to this setting and demonstrate that such a restricted form of data is sufficient to learn compositional meanings of the instructions. Our second article also focuses on instruction following. We develop the BabyAI platform to facilitate further, more extensive and rigorous studies of this setup. The platform features a compositional Baby language with $10^{19}$ instructions, whose semantics is precisely defined in a partially-observable gridworld environment. We report baseline results on how much supervision is required to teach the agent certain subsets of Baby language with different training methods, such as reinforcement learning and imitation learning. In the third article we study systematic generalization of visual question answering (VQA) models. In the VQA setting the system must answer compositional questions about images. We construct a dataset of spatial questions about object pairs and evaluate how well different models perform on questions about pairs of objects that never occured in the same question in the training distribution. We show that models in which word meanings are represented by separate modules that perform independent computation generalize much better than models whose design is not explicitly modular. The modular models, however, generalize well only when the modules are connected in an appropriate layout, and our experiments highlight the challenges of learning the layout by end-to-end learning on the training distribution. In our fourth and final article we also study generalization of VQA models to questions outside of the training distribution, but this time using the popular CLEVR dataset of complex questions about 3D-rendered scenes as the platform. We generate novel CLEVR-like questions by using similarity-based references (e.g. ``the ball that has the same color as .'') in contexts that occur in CLEVR questions but only with location-based references (e.g. ``the ball that is to the left of .''). We analyze zero- and few- shot generalization to CLOSURE after training on CLEVR for a number of existing models as well as a novel one.
Keyword: Applied Sciences - Artificial Intelligence / Sciences appliqués et technologie - Intelligence artificielle (UMI : 0800); Apprentissage profond; Compréhension du langue ancré; Deep Learning; Efficacité de l’échantillon; Généralisation systématique; Grounded Language Learning; Instruction Following; Modèles de réponse visuelle aux questions; Modèles de suivre des instructions; Sample Efficiency; Systematic Generalization; Visual Question Answering
URL: http://hdl.handle.net/1866/23943
BASE
Hide details
2
The visual representation of dual language education
In: Faculty Publications: Department of Teaching, Learning and Teacher Education (2020)
BASE
Show details
3
Ich und Welt verknüpfen. Allgemeinbildung, Vielperspektivität, Partizipation und Inklusion im Sachunterricht ...
null. - : Schneider Verlag Hohengehren GmbH, 2019
BASE
Show details
4
Ich und Welt verknüpfen. Allgemeinbildung, Vielperspektivität, Partizipation und Inklusion im Sachunterricht
Siebach, Martin Hrsg.; Simon, Jaqueline Hrsg.; Simon, Toni Hrsg.. - : Schneider Verlag Hohengehren GmbH, 2019. : Baltmannsweiler, 2019. : pedocs-Dokumentenserver/DIPF, 2019
In: Baltmannsweiler : Schneider Verlag Hohengehren GmbH 2019, 209 S. (2019)
BASE
Show details
5
Selecting and Desigining Visual Curriculum Materials for Inquiry-Based Instruction
In: Faculty Publications (2019)
BASE
Show details
6
Sharing Identity: Indexing Cultural Perspectives through Writing Responses to Graphic Novels
In: SANE journal: Sequential Art Narrative in Education (2018)
BASE
Show details
7
Pre-Service Teachers’ Perspectives on How the Use of TOON Comic Books during Guided Reading Influenced Learning by Struggling Readers
In: SANE journal: Sequential Art Narrative in Education (2018)
BASE
Show details
8
Multisite replication in second language acquisition research: attention to form during listening and reading comprehension
BASE
Show details
9
The Use of Visual Arts in World Language Instruction to Increase Student Motivation and Attitude
In: Boise State University Theses and Dissertations (2017)
BASE
Show details
10
Visual literacy instruction in Cambodian ELT: an action research study and a new pedagogical framework
Khan, Bophan. - : Sydney, Australia : Macquarie University, 2017
BASE
Show details
11
Using Superheroes to Visually and Critically Analyze Comics, Stereotypes, and Society
In: SANE journal: Sequential Art Narrative in Education (2017)
BASE
Show details
12
First Graders’ Use of the Bar Model to Communicate Their Understanding of the Equal Sign
In: Boise State University Theses and Dissertations (2016)
BASE
Show details
13
Teaching Spanish Through the Arts
In: South East Coastal Conference on Languages & Literatures (SECCLL) (2016)
BASE
Show details
14
Facilitating Language and Literacy Skills through Home, School, and Community Connections
In: Curriculum, Foundations, & Reading Faculty Presentations (2016)
BASE
Show details
15
"Stonewall Jackson Is a Unicorn" And "Dixieland DubStep": Creating Middle School Communities That Foster Multimodal Artistic Expressions Based on the American Civil War
In: Curriculum Studies Summer Collaborative (2016)
BASE
Show details
16
INSTRUCTIONAL DESIGN FOR DEAF STUDENTS: AN EXPERIMENTAL STUDY OF MULTIMEDIA INSTRUCTION AND COGNITIVE LOAD
In: Theses and Dissertations--Curriculum and Instruction (2016)
BASE
Show details
17
Do Re Mi? Yes! Using Music and Visual Arts to Promote Thai Children's English Vocabulary Development
Mathayomchan, Somsuda. - : University of North Texas, 2016
BASE
Show details
18
IMMERSE: Interactive Mentoring for Multimodal Experiences in Realistic Social Encounters
In: DTIC (2015)
BASE
Show details
19
SCRIBBLESCHOLAR WAS HERE: Confessional Notes of a Vandal Academic
In: Theses and Dissertations--English (2015)
BASE
Show details
20
Visualizing Abolition: Two Graphic Novels and a Critical Approach to Mass Incarceration for the Composition Classroom
In: SANE journal: Sequential Art Narrative in Education (2015)
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
0
0
0
Bibliographies
1
0
0
0
0
0
0
1
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
40
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern