DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5 6 7
Hits 21 – 40 of 121

21
Using Dependency Syntax-Based Methods for Automatic Detection of Psychiatric Comorbidities
In: Resources and ProcessIng of linguistic, para-linguistic and extra-linguistic Data from people with various forms of cognitive/psychiatric/developmental impairments ; https://hal-imt-atlantique.archives-ouvertes.fr/hal-02861753 ; Resources and ProcessIng of linguistic, para-linguistic and extra-linguistic Data from people with various forms of cognitive/psychiatric/developmental impairments, May 2020, Marseille, France. pp.142-150 ; https://spraakbanken.gu.se/en/rapid-2020 (2020)
BASE
Show details
22
Modélisation et interprétation des catégories taxonomiques des animaux et aliments chez des enfants d'âge préscolaire
In: Extraction et Gestion des connaissances (EGC) ; https://hal.archives-ouvertes.fr/hal-02469861 ; Extraction et Gestion des connaissances (EGC), Jan 2020, Bruxelles, Belgique. pp.245-252 ; https://www.egc.asso.fr/category/publications/actes-egc (2020)
BASE
Show details
23
Standard-based Lexical Models for Automatically Structured Dictionaries ; Modèles lexicaux standardisés pour les dictionnaires à structure automatique
Khemakhem, Mohamed. - : HAL CCSD, 2020
In: https://tel.archives-ouvertes.fr/tel-03153438 ; Computation and Language [cs.CL]. Université de Paris, 2020. English (2020)
Abstract: Dictionaries could be considered as the most comprehensive reservoir of human knowledge, which carry not only the lexical description of words in one or more languages, but also the common awareness of a certain communityabout every known piece of knowledge in a time frame. Print dictionaries are the principle resources which enable the documentation and transfer of such knowledge. They already exist in abundant numbers, while new onesare continuously compiled, even with the recent strong move to digital resources.However, a majority of these dictionaries, even when available digitally, is still not fully structured due to the absence of scalable methods and techniques that can cover the variety of corresponding material. Moreover, the relatively few existing structured resources present limited exchange and query alternatives, given the discrepancy of their data models and formats.In this thesis we address the task of parsing lexical information in print dictionaries through the design of computer models that enable their automatic structuring. Solving this task goes hand in hand with finding a standardised output for these models to guarantee a maximum interoperability among resources and usability for downstream tasks.First, we present different classifications of the dictionaric resources to delimit the category of print dictionaries we aim to process. Second, we introduce the parsing task by providing an overview of the processing challengesand a study of the state of the art. Then, we present a novel approach based on a top-down parsing of the lexical information. We also outline the archiecture of the resulting system, called GROBID-Dictionaries, and the methodology we followed to close the gap between the conception of the system and its applicability to real-world scenarios.After that, we draw the landscape of the leading standards for structured lexical resources. In addition, we provide an analysis of two ongoing initiatives, TEI-Lex-0 and LMF, that aim at the unification of modelling the lexical information in print and electronic dictionaries. Based on that, we present a serialisation format that is inline with the schemes of the two standardisation initiatives and fits the approach implemented in our parsing system.After presenting the parsing and standardised serialisation facets of our lexical models, we provide an empirical study of their performance and behaviour. The investigation is based on a specific machine learning setup andseries of experiments carried out with a selected pool of varied dictionaries.We try in this study to present different ways for feature engineering and exhibit the strength and the limits of the best resulting models. We also dedicate two series of experiments for exploring the scalability of our models with regard to the processed documents and the employed machine learning technique.Finally, we sum up this thesis by presenting the major conclusions and opening new perspectives for extending our investigations in a number of research directions for parsing entry-based documents. ; Les dictionnaires peuvent être considérés comme le réservoir le plus compréhensible de connaissances humaines, qui contiennent non seulement la description lexicale des mots dans une ou plusieurs langues, mais aussi la conscience commune d’une certaine communauté sur chaque élément de connaissance connu dans une période de temps donnée. Les dictionnaires imprimés sont les principales ressources qui permettent la documentation et le transfert de ces connaissances. Ils existent déjà en grand nombre, et de nouveaux dictionnaires sont continuellement compilés.Cependant, la majorité de ces dictionnaires dans leur version numérique n’est toujours pas structurée en raison de l’absence de méthodes et de techniques évolutives pouvant couvrir le nombre du matériel croissant et sa variété. En outre, les ressources structurées existantes, relativement peu nombreuses, présentent des alternatives d’échange et de recherche limitées, en raison d’un sérieux manque de synchronisation entre leurs schémas de structure.Dans cette thèse, nous abordons la tâche d’analyse des informations lexicales dans les dictionnaires imprimés en construisant des modèles qui permettent leur structuration automatique. La résolution de cette tâche va depair avec la recherche d’une sortie standardisée de ces modèles afin de garantir une interopérabilité maximale entre les ressources et une facilité d’utilisation pour les tâches en aval.Nous commençons par présenter différentes classifications des ressources dictionnaires pour délimiter les catégories des dictionnaires imprimés sur lesquelles ce travail se focalise. Ensuite, nous définissions la tâche d’analyse en fournissant un aperçu des défis de traitement et une étude de l’état de l’art.Nous présentons par la suite une nouvelle approche basée sur une analyse en cascade de l’information lexicale. Nous décrivons également l’architecture du système résultant, appelé GROBID-Dictionaries, et la méthodologie quenous avons suivie pour rapprocher la conception du système de son applicabilité aux scénarios du monde réel.Ensuite, nous prestons des normes clés pour les ressources lexicales structurées. En outre, nous fournissons une analyse de deux initiatives en cours, TEI-Lex-0 et LMF, qui visent à unifier la modélisation de l’information lexicale dans les dictionnaires imprimés et électroniques. Sur cette base, nous présentons un format de sérialisation conforme aux schémas des deux initiatives de normalisation et qui est assorti à l’approche développée dans notresystème d’analyse lexicale.Après avoir présenté les facettes d’analyse et de sérialisation normalisées de nos modèles lexicaux, nous fournissons une étude empirique de leurs performances et de leurs comportements. L’étude est basée sur une configuration spécifique d’apprentissage automatique et sur une série d’expériences menées avec un ensemble sélectionné de dictionnaires variés. Dans cette étude, nous essayons de présenter différentes manières d’ingénierie des caractéristiques et de montrer les points forts et les limites des meilleurs modèles résultants. Nous consacrons également deux séries d’expériences pour explorer l’extensibilité de nos modèles en ce qui concerne les documents traités et la technique d’apprentissage automatique employée.Enfin, nous clôturons cette thèse en présentant les principales conclusions et en ouvrant de nouvelles perspectives pour l’extension de nos investigations dans un certain nombre de directions de recherche pour l’analyse des documents structurés en un ensemble d’entrées.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-HC]Computer Science [cs]/Human-Computer Interaction [cs.HC]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [INFO]Computer Science [cs]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; [STAT.ML]Statistics [stat]/Machine Learning [stat.ML]; Analyse; Apprentissage automatique; Automatic structuring; Dictionnaires numérisés; Digitised dictionaries; ISO standard; Lexical models; LMF; Machine learning; Modèles léxicaux; norme ISO; Parsing; Structuration automatique; TEI
URL: https://tel.archives-ouvertes.fr/tel-03153438
https://tel.archives-ouvertes.fr/tel-03153438/file/De%CC%81po%CC%82t%20APRES%20%3E%20ED%20386%20%20%3E%20KHEMAKHEM,%20Mohamed.pdf
https://tel.archives-ouvertes.fr/tel-03153438/document
BASE
Hide details
24
Question Answering with Hybrid Data and Models ; Question-réponse utilisant des données et modèles hybrides
Ramachandra Rao, Sanjay Kamath. - : HAL CCSD, 2020
In: https://tel.archives-ouvertes.fr/tel-02890467 ; Document and Text Processing. Université Paris-Saclay, 2020. English. ⟨NNT : 2020UPASS024⟩ (2020)
BASE
Show details
25
Privacy Amplification by Decentralization
In: https://hal.inria.fr/hal-03100005 ; 2020 (2020)
BASE
Show details
26
Distributed Differentially Private Averaging with Improved Utility and Robustness to Malicious Parties
In: NeurIPS 2020 workshop on Privacy Preserving Machine Learning - PriML and PPML Joint Edition ; https://hal.archives-ouvertes.fr/hal-03117816 ; NeurIPS 2020 workshop on Privacy Preserving Machine Learning - PriML and PPML Joint Edition, Dec 2020, Vancouver (Virtual Workshop), Canada ; https://ppml-workshop.github.io/ (2020)
BASE
Show details
27
Privacy Amplification by Decentralization
In: https://hal.inria.fr/hal-03100005 ; 2020 (2020)
BASE
Show details
28
Fully Decentralized Joint Learning of Personalized Models and Collaboration Graphs
In: AISTATS 2020 - The 23rd International Conference on Artificial Intelligence and Statistics ; https://hal.inria.fr/hal-03100057 ; AISTATS 2020 - The 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palerme / Virtual, Italy ; https://aistats.org/aistats2020/ (2020)
BASE
Show details
29
Échange de bruit corrélé pour le calcul distribué de moyenne avec garanties de confidentialité différentielle
In: Conférence sur l'Apprentissage Automatique 2020 ; https://hal.archives-ouvertes.fr/hal-03117907 ; Conférence sur l'Apprentissage Automatique 2020, Jun 2020, Vannes (Virtual), France ; https://cap-rfiap2020.sciencesconf.org/ (2020)
BASE
Show details
30
Distributed Differentially Private Averaging with Improved Utility and Robustness to Malicious Parties
In: https://hal.inria.fr/hal-03100019 ; 2020 (2020)
BASE
Show details
31
Private Protocols for U-Statistics in the Local Model and Beyond
In: AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics ; https://hal.inria.fr/hal-02310236 ; AISTATS 2020 - 23rd International Conference on Artificial Intelligence and Statistics, Aug 2020, Palermo, Italy (2020)
BASE
Show details
32
Automatic Processing of Aerodynamic Parameters in Parkinsonian Dysarthria
In: Automatic Assessment of Parkinosnian Speech. Ed. Springer Nature Switzerland AG. Communications in Computer and Information Science (CCIS) Series, Vol 1295. ; https://hal.archives-ouvertes.fr/hal-03115366 ; Automatic Assessment of Parkinosnian Speech. Ed. Springer Nature Switzerland AG. Communications in Computer and Information Science (CCIS) Series, Vol 1295., pp.60-76, 2020, ⟨10.1007/978-3-030-65654-6_4⟩ (2020)
BASE
Show details
33
Evaluating the Potential Gain of Auditory and Audiovisual Speech-Predictive Coding Using Deep Learning
In: ISSN: 0899-7667 ; EISSN: 1530-888X ; Neural Computation ; https://hal.archives-ouvertes.fr/hal-03016083 ; Neural Computation, Massachusetts Institute of Technology Press (MIT Press), 2020, 32 (3), pp.596-625. ⟨10.1162/neco_a_01264⟩ (2020)
BASE
Show details
34
NLU-Co at SemEval-2020 Task 5: NLU/SVM based model apply to characterise and extract counterfactual items on raw data
In: COLING ; SemEval-2020 (International Workshop on Semantic Evaluation 2020) ; https://hal.archives-ouvertes.fr/hal-03119450 ; SemEval-2020 (International Workshop on Semantic Evaluation 2020), Dec 2020, Barcelone, Spain. pp.670-676 ; https://www.aclweb.org/anthology/2020.semeval-1.87 (2020)
BASE
Show details
35
Can Knowledge Graph Embeddings Tell Us What Fact-checked Claims Are About?
In: Proceedings of the Workshop on Insights from Negative Results in NLP ; Workshop on Insights from Negative Results in NLP ; https://hal.mines-ales.fr/hal-02986882 ; Workshop on Insights from Negative Results in NLP, Nov 2020, Online, Dominican Republic. ⟨10.18653/v1/2020.insights-1.11⟩ ; https://insights-workshop.github.io/ (2020)
BASE
Show details
36
SMAD: A tool for automatically annotating the smile intensity along a video record
In: HRC2020, 10th Humour Research Conference ; https://hal.archives-ouvertes.fr/hal-02529371 ; HRC2020, 10th Humour Research Conference, Mar 2020, Commerce, Texas, United States (2020)
BASE
Show details
37
NTeALan Dictionaries Platforms: An Example Of Collaboration-Based Model
In: Proceedings of the 1st International Workshop on Language Technology Platforms (IWLTP 2020) ; https://hal.archives-ouvertes.fr/hal-02701912 ; Proceedings of the 1st International Workshop on Language Technology Platforms (IWLTP 2020), 2020, pp.11 - 16 (2020)
BASE
Show details
38
Building Collaboration-based Resources In Endowed African Languages: Case Of NTeALan Dictionaries Platform
In: Proceedings of the First workshop on Resources for African Indigenous Languages (RAIL) ; https://hal.archives-ouvertes.fr/hal-02701162 ; Proceedings of the First workshop on Resources for African Indigenous Languages (RAIL), 2020 (2020)
BASE
Show details
39
NLU-Co at SemEval-2020 Task 5: NLU/SVM based model apply to characterise and extract counterfactual items on raw data
In: COLING ; SemEval-2020 (International Workshop on Semantic Evaluation 2020) ; https://hal.archives-ouvertes.fr/hal-03119450 ; SemEval-2020 (International Workshop on Semantic Evaluation 2020), Dec 2020, Barcelone, Spain. pp.670-676 ; https://www.aclweb.org/anthology/2020.semeval-1.87 (2020)
BASE
Show details
40
How OCR Performance can Impact on the Automatic Extraction of Dictionary Content Structures
In: 19th annual Conference and Members’ Meeting of the Text Encoding Initiative Consortium (TEI) -What is text, really? TEI and beyond ; https://hal.archives-ouvertes.fr/hal-02263276 ; 19th annual Conference and Members’ Meeting of the Text Encoding Initiative Consortium (TEI) -What is text, really? TEI and beyond, Sep 2019, Graz, Austria (2019)
BASE
Show details

Page: 1 2 3 4 5 6 7

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
121
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern