1 |
Leza, Sungu, and Samba- Digital Humanities and Early Bantu History
|
|
|
|
In: Faculty Journal Articles (2022)
|
|
BASE
|
|
Show details
|
|
2 |
Indigenous Language Revitalization: Success, Sustainability, and the Future of Human Culture
|
|
|
|
In: Capstone Showcase (2022)
|
|
BASE
|
|
Show details
|
|
3 |
An Overview of Indian Spoken Language Recognition from Machine Learning Perspective
|
|
|
|
In: ISSN: 2375-4699 ; EISSN: 2375-4702 ; ACM Transactions on Asian and Low-Resource Language Information Processing ; https://hal.inria.fr/hal-03616853 ; ACM Transactions on Asian and Low-Resource Language Information Processing, ACM, In press, ⟨10.1145/3523179⟩ (2022)
|
|
BASE
|
|
Show details
|
|
4 |
The AMAR mechanism: nominal expressions in the Bantu languages are shaped by apposition and reintegration.
|
|
|
|
In: ISSN: 0024-3949 ; EISSN: 1613-396X ; Linguistics ; https://halshs.archives-ouvertes.fr/halshs-03433014 ; Linguistics, De Gruyter, In press, ⟨10.1515/ling-2020-0132⟩ (2022)
|
|
BASE
|
|
Show details
|
|
5 |
US-amerikanische Jiddische und Pennsylvania-Deutsche Medien zwischen lokaler Verankerung und Transnationalisierung
|
|
|
|
In: ISSN: 0014-2115 ; EISSN: 2426-5543 ; Etudes Germaniques ; https://halshs.archives-ouvertes.fr/halshs-03559078 ; Etudes Germaniques, Klincksieck, 2022, Les études germaniques et le transnational : enjeux d’un questionnement scientifique et épistémologique, 76 (3), pp.379-398 (2022)
|
|
BASE
|
|
Show details
|
|
6 |
“Dawning the Word”, language politics for life ; “Amanecer la palabra”, políticas lingüísticas para la vida
|
|
|
|
In: ISSN: 2145-5082 ; Revista Mundo Amazonico ; https://hal.archives-ouvertes.fr/hal-03580959 ; Revista Mundo Amazonico, 2022, Regímenes de movilidad y presencia en la Amazonía urbana, 13 (1) ; https://revistas.unal.edu.co/index.php/imanimundo/article/view/88495 (2022)
|
|
BASE
|
|
Show details
|
|
7 |
Targets and other postverbal arguments in Southern Balochi: A multidimensional cline
|
|
|
|
In: Word Order Variation – Semitic, Turkic and Indo-European Languages in Contact ; https://halshs.archives-ouvertes.fr/halshs-03576429 ; Hiwa Asadpour; Thomas Jügel. Word Order Variation – Semitic, Turkic and Indo-European Languages in Contact, Studia Typologica [STTYP], de Gruyter Mouton, pp.89-125, In press ; https://www.degruyter.com/serial/sttyp-b/html (2022)
|
|
BASE
|
|
Show details
|
|
8 |
Areal Features in the Languages of South Iran: Focus on Balochi and Baskhardi
|
|
|
|
In: Iranian Languages and Linguistics Lecture Series ; https://halshs.archives-ouvertes.fr/halshs-03622909 ; Iranian Languages and Linguistics Lecture Series, Erik Anonby; Arsalan Kahnemuyipour; Université de Toronto, Jan 2022, Toronto, Canada ; https://www.nmc.utoronto.ca/ (2022)
|
|
BASE
|
|
Show details
|
|
9 |
Un dictionnaire peul encyclopédique de l’agriculture et de la nature
|
|
|
|
In: Cahiers du CEDIMES ; https://halshs.archives-ouvertes.fr/halshs-03648615 ; Cahiers du CEDIMES, 2022, 17 (2), pp.165-178 (2022)
|
|
BASE
|
|
Show details
|
|
10 |
Le nouveau vin, c’est quand ? Calendriers dans l’empire multiculturel arsacide
|
|
|
|
In: Langues, territoires, identités. Diversité linguistique et culturelle ; https://halshs.archives-ouvertes.fr/halshs-03622921 ; Langues, territoires, identités. Diversité linguistique et culturelle, Anca Dan; Daniel Petit; ENS, Jan 2022, Paris, France ; http://www.archeo.ens.fr/Langues-territoires-identites (2022)
|
|
BASE
|
|
Show details
|
|
11 |
Language identification, a tool for Corsican and for the evaluation of linguistic resources ; L'identification de langue, un outil au service du corse et de l'évaluation des ressources linguistiques
|
|
|
|
In: Traitement Automatique des Langues ; https://hal.archives-ouvertes.fr/hal-03633290 ; Traitement Automatique des Langues, 2022, Diversité Linguistique, 62 (3), pp.13-37 ; https://www.atala.org/content/diversité-linguistique-linguistic-diversity-natural-language-processing (2022)
|
|
Abstract:
International audience ; The constitution of corpora is one of the first priorities faced by less-resourced languages. The emergence of Internet-based resources of increasing size and covering more and more languages may suggest that this issue has been resolved, but this is not the case. Following Caswell et al. (2021), who evaluated several large resources, including one with Corsican content, we conducted an analysis of two corpora including this language: An Crúbadán and W2C. In parallel to a manual evaluation, we considered the possibility of using one or more language identification modules to filter the content of these resources, which turns out to be possible but at the cost of low recall. For this task, we tested and re-trained various systems in order to adapt them to Corsican. This work makes it possible to provide a model allowing the identification of 17 European languages as well as Corsican ; La constitution de corpus est une des premières priorités que rencontrent les langues peu dotées. L’émergence de ressources issues d’Internet, de tailles de plus en plus imposantes et couvrant de nombreuses langues, peut laisser penser que ce point est désormais résolu, ce qui n’est pas le cas. À la suite de Caswell et al. (2021), qui ont évalué plusieurs ressources de grande envergure, dont une disposant de contenu corse, nous avons mené une analyse de deux corpus incluant cette langue : An Crúbadán et W2C. Parallèlement à une évaluation manuelle, nous avons estimé la possibilité d’utiliser un ou plusieurs modules d’identification de langue afin de filtrer le contenu de ces ressources, ce qui s’avère possible mais au prix d’un rappel peu élevé. Pour cette tâche, nous avons testé et réentraîné divers systèmes afin de les adapter au mieux au corse. Ce travail nous permet de mettre à disposition un modèle capable d’identifier le corse ainsi que 17 autres langues européennes.
|
|
Keyword:
[INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; corpora; corpus; corse; Corsican; identification de langue; language identification; langues peu dotées; less-resourced languages; qualité; quality
|
|
URL: https://hal.archives-ouvertes.fr/hal-03633290/file/TAL_62_3_1_Kevers_HAL.pdf https://hal.archives-ouvertes.fr/hal-03633290/document https://hal.archives-ouvertes.fr/hal-03633290
|
|
BASE
|
|
Hide details
|
|
12 |
Adopter une approche diachronique et contextualisante pour explorer le rapport à l’écrit : l’intérêt d’une prise en compte des répertoires langagiers et des environnements de socialisation.
|
|
|
|
In: ISSN: 2706-6312 ; EISSN: 2708-0633 ; Akofena - Revue scientifique des Sciences du Langage, Lettres, Langues & Communication, ; https://hal.archives-ouvertes.fr/hal-03551355 ; Akofena - Revue scientifique des Sciences du Langage, Lettres, Langues & Communication, , L3DL-CI, Université Félix Houphouët-Boigny, 2022 (2022)
|
|
BASE
|
|
Show details
|
|
13 |
Social sciences’ last hope: giving plurilingualism a chance [chapter 14]
|
|
|
|
In: The Routledge Handbook of Plurilingual Language Education ; https://hal.archives-ouvertes.fr/hal-03535601 ; Enricca Piccardo; Aline Germain-Rutherford; Geoff Lawrence. The Routledge Handbook of Plurilingual Language Education, Routledge, pp.263-275, 2022, 9781138545625 ; https://www.routledge.com/The-Routledge-Handbook-of-Plurilingual-Language-Education/Piccardo-Germain-Rutherford-Lawrence/p/book/9781138545625# (2022)
|
|
BASE
|
|
Show details
|
|
16 |
Ludwig Wittgenstein: The Nature of Religion - Irfan Ajvazi ...
|
|
|
|
BASE
|
|
Show details
|
|
18 |
Finding the best way to put media bias research into practice via an annotation app ...
|
|
|
|
BASE
|
|
Show details
|
|
20 |
Semantics and interpretation of the response particles ano ‘yes’ and ne ‘no’ ...
|
|
|
|
BASE
|
|
Show details
|
|
|
|