DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 42

1
Recognition of the Mental Workloads of Pilots in the Cockpit Using EEG Signals
In: Applied Sciences; Volume 12; Issue 5; Pages: 2298 (2022)
BASE
Show details
2
Realistic Image Generation from Text by Using BERT-Based Embedding
In: Electronics; Volume 11; Issue 5; Pages: 764 (2022)
BASE
Show details
3
Explainable Multimodal Fusion
Alvi, Jaweriah. - : KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021
BASE
Show details
4
Essays on Representation Learning for Political Science Research
Wu, Patrick. - 2021
BASE
Show details
5
Wiki-MLM: Multiple Languages and Modalities ...
BASE
Show details
6
Wiki-MLM: Multiple Languages and Modalities ...
BASE
Show details
7
MLM: A Benchmark Dataset for Multitask Learning with Multiple Languages and Modalities ...
BASE
Show details
8
MLM: A Benchmark Dataset for Multitask Learning with Multiple Languages and Modalities ...
BASE
Show details
9
Wiki-MLM: Multiple Languages and Modalities ...
BASE
Show details
10
Multimodal deep networks for text and image-based document classification ; Réseau de neurones multimodal pour la classification de documents image/texte
In: Conférence Nationale sur les Applications Pratiques de l'Intelligence Artificielle (APIA) ; https://hal.archives-ouvertes.fr/hal-02163257 ; Conférence Nationale sur les Applications Pratiques de l'Intelligence Artificielle (APIA), Jul 2019, Toulouse, France (2019)
Abstract: International audience ; Classification of document images is a critical step for archival of old manuscripts, online subscription and administrative procedures. Computer vision and deep learning have been suggested as a first solution to classify documents based on their visual appearance. However, achieving the fine-grained classification that is required in real-world setting cannot be achieved by visual analysis alone. Often, the relevant information is in the actual text content of the document. We design a multimodal neural network that is able to learn from word embeddings, computed on text extracted by OCR, and from the image. We show that this approach boosts pure image accuracy by 3% on Tobacco3482 and RVL-CDIP augmented by our new QS-OCR text dataset (https://github.com/Quicksign/ocrized-text-dataset), even without clean text information. ; La classification automatique de documents numérisés est im-portante pour la dématérialisation de documents historiques comme de procédures administratives. De premières ap-proches ont été suggérées en appliquant des réseaux con-volutifs aux images de documents en exploitant leur aspect visuel. Toutefois, la précision des classes demandée dans un contexte réel dépend souvent de l'information réellement contenue dans le texte, et pas seulement dans l'image. Nous introduisons un réseau de neurones multimodal capable d'apprendre à partir d'un plongement lexical du texte ex-trait par reconnaissance de caractères et des caractéris-tiques visuelles de l'image. Nous démontrons la pertinence de cette approche sur Tobacco3482 et RVL-CDIP, augmen-tés de notre jeu de données textuel QS-OCR (https://github.com/Quicksign/ocrized-text-dataset), sur lesquels nous améliorons les performances d'un modèle image de 3% grâce à l'information sémantique textuelle.
Keyword: [INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV]; [INFO.INFO-NE]Computer Science [cs]/Neural and Evolutionary Computing [cs.NE]; [INFO.INFO-TI]Computer Science [cs]/Image Processing [eess.IV]; apprentissage multimodal; apprentissage profond; classification de documents; data fusion; deep learning; Document classification; fusion de données; multimodal learning
URL: https://hal.archives-ouvertes.fr/hal-02163257
https://hal.archives-ouvertes.fr/hal-02163257/document
https://hal.archives-ouvertes.fr/hal-02163257/file/article_apia.pdf
BASE
Hide details
11
Graph-Based Prediction of Meeting Participation
In: Multimodal Technologies and Interaction ; Volume 3 ; Issue 3 (2019)
BASE
Show details
12
Nouvelles actions didactiques : faire de la sociolinguistique de corpus pour enseigner et apprendre à interagir en français langue étrangère
In: Action Didactique ; https://hal.archives-ouvertes.fr/hal-01862713 ; Action Didactique, Laboratoire de recherche en Langues Appliquées et Ingénierie des Langues En Milieu Multilingue (LAILEMM), Faculté des Lettres et des Langues de l’université Abderrahmane Mira de Bejaia, 2018, 1 (71-88) ; http://univ-bejaia.dz/ad1 (2018)
BASE
Show details
13
The Grid Audio-Visual Lombard Speech Corpus ...
BASE
Show details
14
The Grid Audio-Visual Lombard Speech Corpus ...
BASE
Show details
15
Human-Like Neural-Symbolic Computing (Dagstuhl Seminar 17192)
Besold, Tarek R.; d'Avila Garcez, Artur; Lamb, Luis C.. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2017. : Dagstuhl Reports. Dagstuhl Reports, Volume 7, Issue 5, 2017
BASE
Show details
16
Use of comic creolized texts in teaching English
SHUSTROVA ELIZAVETA VLADIMIROVNA. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2016
BASE
Show details
17
Assessing text and web accessibility for people with autism spectrum disorder
BASE
Show details
18
ПОЛИТИЧЕСКАЯ КАРИКАТУРА КАК ИСТОЧНИК ПРЕЦЕДЕНТНОСТИ ПРИ ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ В ЯЗЫКОВОМ ВУЗЕ
КУРЕННАЯ АНАСТАСИЯ ВАЛЕРЬЕВНА; ШУСТРОВА ЕЛИЗАВЕТА ВЛАДИМИРОВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2015
BASE
Show details
19
ИСПОЛЬЗОВАНИЕ КРЕОЛИЗОВАННЫХ ТЕКСТОВ В КУРСАХ ЛИГВОСТРАНОВЕДЧЕСКОЙ НАПРАВЛЕННОСТИ
ШУСТРОВА ЕЛИЗАВЕТА ВЛАДИМИРОВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2015
BASE
Show details
20
Collaborative Annotation for Person Identification in TV Shows
In: Interspeech 2015 (short demo paper) ; https://hal.archives-ouvertes.fr/hal-01170513 ; Interspeech 2015 (short demo paper), Sep 2015, Dresden, Germany (2015)
BASE
Show details

Page: 1 2 3

Catalogues
1
0
1
0
0
0
0
Bibliographies
2
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
40
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern