Home Catalogue search

eng

Refine your search:
- Keyword
- Creator / Publisher
- Year:
  - 2022 (2)
  - 2021 (2)
  - 2020 (5)
  - 2019 (2)
  - 2018 (3)
  - 2017 (1)
  - 2016 (2)
  - 2015 (3)
  - 2014 (4)
  - 2013 (4)
  - more
- Medium
- Type:
- BLLDB-Access

Search in the Catalogues and Directories






	Sort by
Simple Search

Page: 1 2 3

Hits 1 – 20 of 42

1	Recognition of the Mental Workloads of Pilots in the Cockpit Using EEG Signals
	Aura Hernández-Sabaté; José Yauri; Pau Folch; Miquel Àngel Piera; Debora Gil
	In: Applied Sciences; Volume 12; Issue 5; Pages: 2298 (2022)
	BASE
	Show details

2	Realistic Image Generation from Text by Using BERT-Based Embedding
	Sanghyuck Na; Mirae Do; Kyeonah Yu; Juntae Kim
	In: Electronics; Volume 11; Issue 5; Pages: 764 (2022)
	BASE
	Show details

3	Explainable Multimodal Fusion
	Alvi, Jaweriah. - : KTH, Skolan för elektroteknik och datavetenskap (EECS), 2021
	BASE
	Show details

4	Essays on Representation Learning for Political Science Research
	Wu, Patrick. - 2021
	BASE
	Show details

5	Wiki-MLM: Multiple Languages and Modalities ...
	Armitage, Jason; Kacupaj, Endri; Tahmasebzadeh, Golsa. - : Zenodo, 2020
	BASE
	Show details

6	Wiki-MLM: Multiple Languages and Modalities ...
	Armitage, Jason; Kacupaj, Endri; Tahmasebzadeh, Golsa. - : Zenodo, 2020
	BASE
	Show details

7	MLM: A Benchmark Dataset for Multitask Learning with Multiple Languages and Modalities ...
	Armitage, Jason; Kacupaj, Endri; Tahmasebzadeh, Golsa. - : Zenodo, 2020
	BASE
	Show details

8	MLM: A Benchmark Dataset for Multitask Learning with Multiple Languages and Modalities ...
	Armitage, Jason; Kacupaj, Endri; Tahmasebzadeh, Golsa. - : Zenodo, 2020
	BASE
	Show details

9	Wiki-MLM: Multiple Languages and Modalities ...
	Armitage, Jason; Kacupaj, Endri; Tahmasebzadeh, Golsa. - : Zenodo, 2020
	BASE
	Show details

10	Multimodal deep networks for text and image-based document classification ; Réseau de neurones multimodal pour la classification de documents image/texte
	Audebert, Nicolas; Herold, Catherine; Slimani, Kuider; Vidal, Cédric
	In: Conférence Nationale sur les Applications Pratiques de l'Intelligence Artificielle (APIA) ; https://hal.archives-ouvertes.fr/hal-02163257 ; Conférence Nationale sur les Applications Pratiques de l'Intelligence Artificielle (APIA), Jul 2019, Toulouse, France (2019)
	Abstract: International audience ; Classification of document images is a critical step for archival of old manuscripts, online subscription and administrative procedures. Computer vision and deep learning have been suggested as a first solution to classify documents based on their visual appearance. However, achieving the fine-grained classification that is required in real-world setting cannot be achieved by visual analysis alone. Often, the relevant information is in the actual text content of the document. We design a multimodal neural network that is able to learn from word embeddings, computed on text extracted by OCR, and from the image. We show that this approach boosts pure image accuracy by 3% on Tobacco3482 and RVL-CDIP augmented by our new QS-OCR text dataset (https://github.com/Quicksign/ocrized-text-dataset), even without clean text information. ; La classification automatique de documents numérisés est im-portante pour la dématérialisation de documents historiques comme de procédures administratives. De premières ap-proches ont été suggérées en appliquant des réseaux con-volutifs aux images de documents en exploitant leur aspect visuel. Toutefois, la précision des classes demandée dans un contexte réel dépend souvent de l'information réellement contenue dans le texte, et pas seulement dans l'image. Nous introduisons un réseau de neurones multimodal capable d'apprendre à partir d'un plongement lexical du texte ex-trait par reconnaissance de caractères et des caractéris-tiques visuelles de l'image. Nous démontrons la pertinence de cette approche sur Tobacco3482 et RVL-CDIP, augmen-tés de notre jeu de données textuel QS-OCR (https://github.com/Quicksign/ocrized-text-dataset), sur lesquels nous améliorons les performances d'un modèle image de 3% grâce à l'information sémantique textuelle.
	Keyword: [INFO.INFO-CV]Computer Science [cs]/Computer Vision and Pattern Recognition [cs.CV]; [INFO.INFO-NE]Computer Science [cs]/Neural and Evolutionary Computing [cs.NE]; [INFO.INFO-TI]Computer Science [cs]/Image Processing [eess.IV]; apprentissage multimodal; apprentissage profond; classification de documents; data fusion; deep learning; Document classification; fusion de données; multimodal learning
	URL: https://hal.archives-ouvertes.fr/hal-02163257 https://hal.archives-ouvertes.fr/hal-02163257/document https://hal.archives-ouvertes.fr/hal-02163257/file/article_apia.pdf
	BASE
	Hide details

11	Graph-Based Prediction of Meeting Participation
	Gabriel Murray
	In: Multimodal Technologies and Interaction ; Volume 3 ; Issue 3 (2019)
	BASE
	Show details

12	Nouvelles actions didactiques : faire de la sociolinguistique de corpus pour enseigner et apprendre à interagir en français langue étrangère
	André, Virginie
	In: Action Didactique ; https://hal.archives-ouvertes.fr/hal-01862713 ; Action Didactique, Laboratoire de recherche en Langues Appliquées et Ingénierie des Langues En Milieu Multilingue (LAILEMM), Faculté des Lettres et des Langues de l’université Abderrahmane Mira de Bejaia, 2018, 1 (71-88) ; http://univ-bejaia.dz/ad1 (2018)
	BASE
	Show details

13	The Grid Audio-Visual Lombard Speech Corpus ...
	Alghamdi, Najwa; Maddock, Steve; Marxer, Ricard. - : Zenodo, 2018
	BASE
	Show details

14	The Grid Audio-Visual Lombard Speech Corpus ...
	Alghamdi, Najwa; Maddock, Steve; Marxer, Ricard. - : Zenodo, 2018
	BASE
	Show details

15	Human-Like Neural-Symbolic Computing (Dagstuhl Seminar 17192)
	Besold, Tarek R.; d'Avila Garcez, Artur; Lamb, Luis C.. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2017. : Dagstuhl Reports. Dagstuhl Reports, Volume 7, Issue 5, 2017
	BASE
	Show details

16	Use of comic creolized texts in teaching English
	SHUSTROVA ELIZAVETA VLADIMIROVNA. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2016
	BASE
	Show details

17	Assessing text and web accessibility for people with autism spectrum disorder
	Yaneva, Victoria. - 2016
	BASE
	Show details

18	ПОЛИТИЧЕСКАЯ КАРИКАТУРА КАК ИСТОЧНИК ПРЕЦЕДЕНТНОСТИ ПРИ ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ В ЯЗЫКОВОМ ВУЗЕ
	КУРЕННАЯ АНАСТАСИЯ ВАЛЕРЬЕВНА; ШУСТРОВА ЕЛИЗАВЕТА ВЛАДИМИРОВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2015
	BASE
	Show details

19	ИСПОЛЬЗОВАНИЕ КРЕОЛИЗОВАННЫХ ТЕКСТОВ В КУРСАХ ЛИГВОСТРАНОВЕДЧЕСКОЙ НАПРАВЛЕННОСТИ
	ШУСТРОВА ЕЛИЗАВЕТА ВЛАДИМИРОВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Уральский государственный педагогический университет», 2015
	BASE
	Show details

20	Collaborative Annotation for Person Identification in TV Shows
	Budnik, Matheuz; Besacier, Laurent; Poignant, Johann...
	In: Interspeech 2015 (short demo paper) ; https://hal.archives-ouvertes.fr/hal-01170513 ; Interspeech 2015 (short demo paper), Sep 2015, Dresden, Germany (2015)
	BASE
	Show details

Page: 1 2 3

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern