DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5 6
Hits 1 – 20 of 116

1
Understanding Feature Focus in Multitask Settings for Lexico-semantic Relation Identification
In: à paraître ; Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2021) ; https://hal.archives-ouvertes.fr/hal-03220236 ; Joint Conference of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (ACL-IJCNLP 2021), ACL : Association for Computational Linguistics; Asian Federation of Natural Language Processing, Aug 2021, Bangkok (complete virtual format), Thailand ; https://2021.aclweb.org/ (2021)
BASE
Show details
2
Patch-based Identification of Lexical Semantic Relations
In: 42nd European Conference on Information Retrieval (ECIR) ; https://hal.archives-ouvertes.fr/hal-02400661 ; 42nd European Conference on Information Retrieval (ECIR), 2020, Lisbon, Portugal (2020)
BASE
Show details
3
CORPUS17: a philological corpus for 17th c. French ; CORPUS17: un corpus philologique pour le 17ème siècle français
In: Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20) ; https://hal.archives-ouvertes.fr/hal-03041871 ; Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3424002⟩ (2020)
BASE
Show details
4
Εntity-level Εvent Ιmpact Αnalytics ; Analyse de l’Impact des Événements au Niveau des Entités
Govind, Govind. - : HAL CCSD, 2019
In: https://hal.archives-ouvertes.fr/tel-02102795 ; Document and Text Processing. Normandie Université, Unicaen, EnsiCaen, CNRS, GREYC UMR 6072, 2019. English (2019)
BASE
Show details
5
Model-driven Web Page Segmentation for Non Visual Access
In: 16th International Conference of the Pacific Association for Computational Linguistics (PACLING 2019) ; https://hal.archives-ouvertes.fr/hal-02309612 ; 16th International Conference of the Pacific Association for Computational Linguistics (PACLING 2019), Oct 2019, Hanoï City, Vietnam (2019)
BASE
Show details
6
Explorationtextométriqued’uncorpusdemotifsjuridiquesdansledroitinternationaldestransportsExploration textométrique d’un corpus de motifs juridiques dans le droit international des transports •
In: lexicometrica ; 14ème Journées internationales d’Analyse statistique des Données Textuelles(JADT18) ; https://halshs.archives-ouvertes.fr/halshs-02358334 ; 14ème Journées internationales d’Analyse statistique des Données Textuelles(JADT18), Viola Talucci (Tor Vergata University – Rome), Jun 2018, Rome, Italie. p. 755-763 (2018)
BASE
Show details
7
An Experimental Approach For Information Extraction in Multi-Party Dialogue Discourse
In: CICLing 2018 - 19th International Conference on Computational Linguistics and Intelligent Text Processing ; https://hal.archives-ouvertes.fr/hal-01804147 ; CICLing 2018 - 19th International Conference on Computational Linguistics and Intelligent Text Processing, Mar 2018, Hanoi, Vietnam. pp.1-14 (2018)
BASE
Show details
8
Identifying Temporal Orientation of Word Senses Based on Minimum Cuts
In: The 20th SIGNLL Conference on Computational Natural Language Learning (CoNLL 2016) ; https://hal.archives-ouvertes.fr/hal-01702812 ; The 20th SIGNLL Conference on Computational Natural Language Learning (CoNLL 2016), Aug 2016, Berlin, Germany. pp.22 - 30 (2016)
BASE
Show details
9
A Deep HMM model for multiple keywords spotting in handwritten documents
In: ISSN: 1433-7541 ; EISSN: 1433-755X ; Pattern Analysis and Applications ; https://hal.archives-ouvertes.fr/hal-01089151 ; Pattern Analysis and Applications, Springer Verlag, 2015, 18 (4), pp.1003-1015 (2015)
BASE
Show details
10
Learning Pretopological Spaces for Lexical Taxonomy Acquisition
In: European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases ; https://hal.archives-ouvertes.fr/hal-01163702 ; European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases, Sep 2015, Porto, Portugal (2015)
BASE
Show details
11
QASSIT: A Pretopological Framework for the Automatic Construction of Lexical Taxonomies from Raw Texts
In: International Workshop on Semantic Evaluation (SEMEVAL 2015) ; https://hal.archives-ouvertes.fr/hal-01144344 ; International Workshop on Semantic Evaluation (SEMEVAL 2015), 2015, Denver, United States (2015)
BASE
Show details
12
Verses and measures: detection of vowel nuclei ; Des vers et des mesures : détection des noyaux vocaliques
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-01380142 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2015, Traitement automatique des textes versifiés : problématiques et pratiques, pp.107-124. ⟨10.3917/lang.199.0107⟩ (2015)
BASE
Show details
13
Recurent neural network for handwriting recognition ; Reconnaissance de l’écriture manuscrite avec des réseaux récurrents
Mioulet, Luc. - : HAL CCSD, 2015
In: https://hal.archives-ouvertes.fr/tel-01301728 ; Traitement du texte et du document. Université de rouen, 2015. Français (2015)
Abstract: Mass digitization of paper documents requires highly efficient optical cha-racter recognition systems. Digital versions of paper documents enable the useof search engines through keyword dectection or the extraction of high levelinformation (e.g. : titles, author, dates). Unfortunately writing recognition sys-tems and especially handwriting recognition systems are still far from havingsimilar performance to that of a human being on the most difficult documents.This industrial PhD (CIFRE) between Airbus DS and the LITIS, that tookplace within the MAURDOR project time frame, aims to seek out and improvethe state of the art systems for handwriting recognition.We compare different systems for handwriting recognition. Our compa-risons include various feature sets as well as various dynamic classifiers : i)Hidden Markov Models, ii) hybrid neural network/HMM, iii) hybrid recurrentnetwork Bidirectional Long Short Term Memory - Connectionist TemporalClassification (BLSTM-CTC)/MMC, iv) a hybrid Conditional Random Fields(CRF)/HMM. We compared these results within the framework of the WR2task of the ICDAR 2009 competition, namely a word recognition task usinga 1600 word lexicon. Our results rank the BLSTM-CTC/HMM system as themost performant, as well as clearly showing that BLSTM-CTCs trained ondifferent features are complementary.Our second contribution aims at using this complementary. We explorevarious combination strategies that take place at different levels of the BLSTM-CTC architecture : low level (early fusion), mid level (within the network),high level (late integration). Here again we measure the performances of theWR2 task of the ICDAR 2009 competition. Overall our results show thatour different combination strategies improve on the single feature systems,moreover our best combination results are close to that of the state of theart system on the same task. On top of that we have observed that some ofour combinations are more adapted for systems using a lexicon to correct amistake, while other are better suited for systems with no lexicon.Our third contribution is focused on tasks related to handwriting recognition. We present two systems, one designed for language recognition, theother one for keyword detection, either from a text query or an image query.For these two tasks our systems stand out from the literature since they usea handwriting recognition step. Indeed most literature systems focus on extracting image features for classification or comparison, wich does not seemappropriate given the tasks. Our systems use a handwriting recognition stepfollowed either by a language detection step or a word detection step, depending on the application. ; La numérisation massive de documents papier a fait apparaître le besoin d’avoir des systèmes de reconnaissance de l’écriture extrêmement performants. La numérisation de ces documents permet d’effectuer des opérations telles que des recherches de mots clefs ou l’extraction d’informations de haut niveau (titre, auteur, adresses, et.). Cependant la reconnaissance de l’écriture et en particulier l’écriture manuscrite ne sont pas encore au niveau de performance de l’homme sur des documents complexes, ce qui restreint ou nuit à certaines applications. Cette thèse CIFRE entre Airbus DS et le LITIS, dans le cadre du projet MAURDOR, a pour but de mettre en avant et d’améliorer les méthodes état de l’art dans le domaine de la reconnaissance de l’écriture manuscrite. Nos travaux comparent différents systèmes permettant d’effectuer la reconnaissance de l’écriture manuscrite. Nous comparons en particulier différentes caractéristiques et différents classifieurs dynamiques : i) Modèles de Markov Cachés (MMC), ii) hybride réseaux de neurones/MMC, iii) hybride réseaux récurrents « Bidirectional Long Short Term Memory - Connectionist Temporal Classification » (BLSTM-CTC)/MMC et iv) hybride Champs Aléatoires Conditionnels (CAC)/MMC. Les comparaisons sont réalisées dans les conditions de la tâche WR2 de la compétition ICDAR 2009, c’est à dire une tâche de reconnaissance de mots isolés avec un dictionnaire de 1600 mots. Nous montrons la supériorité de l’hybride BLSTM-CTC/MMC sur les autres classifieurs dynamiques ainsi que la complémentarité des sorties des BLSTM-CTC utilisant différentes caractéristiques.Notre seconde contribution vise à exploiter ces complémentarités. Nous explorons des stratégies de combinaisons opérant à différents niveaux de la structure des BLSTM-CTC : bas niveau (en entrée), moyen niveau (dans le réseau), haut niveau (en sortie). Nous nous plaçons de nouveau dans les conditions de la tâche WR2 de la compétition ICDAR 2009. De manière générale nos combinaisons améliorent les résultats par rapport aux systèmes individuels, et nous avoisinons les performances du meilleur système de la compétition. Nous avons observé que certaines combinaisons sont adaptées à des systèmes sans lexique tandis que d’autres sont plus appropriées pour des systèmes avec lexique. Notre troisième contribution se situe sur deux applications liées à la reconnaissance de l’écriture. Nous présentons un système de reconnaissance de la langue ainsi qu’un système de détection de mots clefs, à partir de requêtes images et de requêtes de texte. Dans ces deux applications nous présentons une approche originale faisant appel à la reconnaissance de l’écriture. En effet la plupart des systèmes de la littérature extraient des caractéristiques des image pour déterminer une langue ou trouver des images similaires, ce qui n’est pas nécessairement l’approche la plus adaptée au problème à traiter. Nos approches se basent sur une phase de reconnaissance de l’écriture puis une analyse du texte afin de déterminer la langue ou de détecter un mot clef recherché.
Keyword: [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; analyse d’images de documents; champs aléatoires conditionnels; conditional random fields; détection de mots clefs; document image analysis; handwriting recognition; hidden Markov models; keyword spotting; language detection; Modèles de Markov cachés; reconnaissance de langue; reconnaissance de l’écriture; recurrent neural network; réseaux récurrents
URL: https://hal.archives-ouvertes.fr/tel-01301728/document
https://hal.archives-ouvertes.fr/tel-01301728
https://hal.archives-ouvertes.fr/tel-01301728/file/these.pdf
BASE
Hide details
14
Intrinsic and extrinsic evaluation of boilerplate removal tool ; Évaluation intrinsèque et extrinsèque du nettoyage de pages Web
In: Traitement Automatique des Langues Naturelles 2015 ; https://hal.archives-ouvertes.fr/hal-01170005 ; Traitement Automatique des Langues Naturelles 2015, Jun 2015, Caen, France (2015)
BASE
Show details
15
Writing Type and Language Identification in Heterogeneous and Complex Documents
In: 2014 14th International Conference on Frontiers in Handwriting Recognition ; 2014 14th International Conference on Frontiers in Handwriting Recognition (ICFHR) ; https://hal-normandie-univ.archives-ouvertes.fr/hal-02110368 ; 2014 14th International Conference on Frontiers in Handwriting Recognition (ICFHR), Sep 2014, Heraklion, Greece. pp.411-416, ⟨10.1109/ICFHR.2014.75⟩ (2014)
BASE
Show details
16
A Hybrid CRF/HMM Approach for Handwriting Recognition
In: ICIAR ; https://hal.archives-ouvertes.fr/hal-01089170 ; ICIAR, 2014, Vilamoura, Portugal. pp.403 - 410, ⟨10.1007/978-3-319-11758-4_44⟩ (2014)
BASE
Show details
17
Identification of Shell Nouns, Signals of Discourse Organisation ; Identification des noms sous-spécifiés, signaux de l’organisation discursive
In: Proceedings of TALN 2014 (Volume 1: Long Papers) ; 21ème conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01076760 ; 21ème conférence sur le Traitement Automatique des Langues Naturelles, Jul 2014, Marseille, France. pp.377-388 ; https://www.aclweb.org/anthology/F14-1033 (2014)
BASE
Show details
18
A Framework for Temporal Web Analytics ; Un cadre pour l’analyse temporelle d’Internet
Spaniol, Marc. - : HAL CCSD, 2014
In: https://hal.archives-ouvertes.fr/tel-01103973 ; Document and Text Processing. Université de Caen, 2014 (2014)
BASE
Show details
19
Apports de l'analyse automatique multilingue pour la veille épidémiologique
In: Journées internationales d’Analyse statistique des Données Textuelles ; https://hal.archives-ouvertes.fr/hal-01075057 ; Journées internationales d’Analyse statistique des Données Textuelles, Jun 2014, Paris, France (2014)
BASE
Show details
20
Document Model and Prototyping Methods for Web Engineering
In: ISSN: 1947-8186 ; EISSN: 1947-8194 ; International Journal of Information System Modeling and Design ; https://hal.archives-ouvertes.fr/hal-01076417 ; International Journal of Information System Modeling and Design, IGI Global, 2014, 5 (4), 27 p. ⟨10.4018/ijismd.2014100105⟩ (2014)
BASE
Show details

Page: 1 2 3 4 5 6

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
116
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern