1 |
Metalexicographical Investigations with the DiCo Database
|
|
|
|
In: ISSN: 0950-3846 ; EISSN: 1477-4577 ; International Journal of Lexicography ; https://halshs.archives-ouvertes.fr/halshs-03605596 ; International Journal of Lexicography, Oxford University Press (OUP), 2022, 35 (1), pp.75-106. ⟨10.1093/ijl/ecab017⟩ (2022)
|
|
BASE
|
|
Show details
|
|
2 |
Extraire et encoder l'information lexicale de Wiktionary : quel boulot pour étrangler le goulot !
|
|
|
|
In: ISSN: 0756-7138 ; Lexique ; https://halshs.archives-ouvertes.fr/halshs-03083521 ; Lexique, Presses Universitaires du Septentrion, 2020, Ressources Lexicales, 27 (2020)
|
|
Abstract:
International audience ; We present in this article an effort carried out for a decade which consists in using the content of the Wiktionary collaborative dictionary in order to build free lexical resources. Its main result is the design of machine-readable dictionaries and inflectional lexicons for three languages (French, Italian and English). In this paper, we question the usefulness of such lexical resources at a time when mainstream NLP is based on machine learning and readily do without. We compare different methods of producing resources and more specifically of extracting information from Wiktionary. We then discuss the suitability of standard formats for encoding idiosyncratic resources such as Wiktionary and conclude on the need to prioritize, above all, the production and sharing of resources. ; Nous présentons dans cet article une démarche menée depuis une décennie qui consiste à exploiter le contenu du dictionnaire collaboratif Wiktionary afin de construire des ressources lexicales libres. Notre approche a permis de doter trois langues (le français, l'italien et l'anglais) en dictionnaires électroniques et en lexiques flexionnels. Nous questionnons l’utilité des ressources lexicales à un moment où la plupart des systèmes de TAL par apprentissage automatique s’en passent complètement. Nous profitons également de ce retour d’expérience pour comparer différentes méthodes de production de ressources et plus spécifiquement différentes méthodes d’extraction d’informations à partir de Wiktionary. Nous discutons ensuite de la pertinence des formats standards pour l’encodage de ressources idiosyncratiques telles que Wiktionary. Nous concluons sur la nécessité de prioriser, avant tout, la production et le partage de ressources.
|
|
Keyword:
[SHS.LANGUE]Humanities and Social Sciences/Linguistics; dictionnaires électroniques; encoding formats; extraction d'informations; formats d'encodage; free lexical resources; information extraction; machine-readable dictionaries; ressources lexicales libres; Wiktionary
|
|
URL: https://halshs.archives-ouvertes.fr/halshs-03083521/file/SajousEtAl2020_Lexique27_ExtraireInformationLexicaleWiktionary.pdf https://halshs.archives-ouvertes.fr/halshs-03083521/document https://halshs.archives-ouvertes.fr/halshs-03083521
|
|
BASE
|
|
Hide details
|
|
3 |
Glawinette: a linguistically motivated derivational description of French acquired from GLAWI
|
|
|
|
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; 12th International Conference on Language Resources and Evaluation (LREC 2020) ; https://halshs.archives-ouvertes.fr/halshs-02929815 ; 12th International Conference on Language Resources and Evaluation (LREC 2020), May 2020, Marseille, France. pp.3877‑3885 (2020)
|
|
BASE
|
|
Show details
|
|
4 |
Les domaines de spécialité dans les dictionnaires généraux ... : Le lexique de l'informatique analysé par les foules et par les professionnels… de la lexicographie ...
|
|
|
|
BASE
|
|
Show details
|
|
5 |
Du vin et devin dans le Wiktionnaire : neutralité de point de vue ou neutralité et point de vue ?
|
|
|
|
In: ISSN: 0071-190X ; EISSN: 1965-0477 ; Études de linguistique appliquée : revue de didactologie des langues-cultures ; https://halshs.archives-ouvertes.fr/halshs-02334805 ; Études de linguistique appliquée : revue de didactologie des langues-cultures, Klincksieck (Didier Erudition jusqu'en 2003), 2019, 194 (2), pp.147-164 (2019)
|
|
BASE
|
|
Show details
|
|
8 |
From GLÀFF to PsychoGLÀFF: a Large Psycholinguistics-oriented French Lexical Resource
|
|
|
|
In: Proceedings of the 16th EURALEX International Congress: The User in Focus, Bolzano/Bozen, Italien 15 - 19 July 2014 (2014), 431-446
|
|
IDS OBELEX meta
|
|
Show details
|
|
9 |
Présentation de l'atelier SemDis 2014 : sémantique distributionnelle pour la substitution lexicale et l'exploration de corpus spécialisés
|
|
|
|
In: 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014) ; https://hal.archives-ouvertes.fr/hal-01022216 ; 21e Conférence sur le Traitement Automatique des Langues Naturelles (TALN 2014), Jun 2014, Marseille, France. pp.196-205 (2014)
|
|
BASE
|
|
Show details
|
|
10 |
Enrichissement de lexiques sémantiques approvisionnés par les foules : le système WISIGOTH appliqué à Wiktionary
|
|
|
|
In: ISSN: 1248-9433 ; EISSN: 1965-0906 ; Revue TAL ; https://hal.archives-ouvertes.fr/hal-00703227 ; Revue TAL, ATALA (Association pour le Traitement Automatique des Langues), 2011, 52 (1), pp.11-35 (2011)
|
|
BASE
|
|
Show details
|
|
|
|