DE eng

Search in the Catalogues and Directories

Hits 1 – 10 of 10

1
Building a Universal Dependencies Treebank for Occitan
In: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020) ; 12th Language Resources and Evaluation Conference ; https://hal.archives-ouvertes.fr/hal-02892715 ; 12th Language Resources and Evaluation Conference, May 2020, Marseille, France. pp.2932-2939 (2020)
BASE
Show details
2
L’avenir numérique des langues minoritaires : bilan du projet RESTAURE pour l’alsacien, l’occitan et le picard
In: ISSN: 2105-0368 ; Les Cahiers du GEPE ; Colloque « Langues minoritaires » : quels acteurs pour quel avenir ? ; https://hal.archives-ouvertes.fr/hal-02378172 ; Les Cahiers du GEPE, Université de Strasbourg, 2020, Langues minoritaires : Quels acteurs pour quel avenir ? ; http://cahiersdugepe.fr/index.php?id=3662 (2020)
BASE
Show details
3
Analyse contrastive des noms sous-spécifiés à l’oral et à l’écrit à partir d’une extraction automatique
In: ISSN: 0458-726X ; EISSN: 1958-9549 ; Langages ; https://hal.archives-ouvertes.fr/hal-03559965 ; Langages, Armand Colin (Larousse jusqu'en 2003), 2020, N°219 (3), pp.117. ⟨10.3917/lang.219.0117⟩ (2020)
BASE
Show details
4
Linguatec Tolosa Treebank ...
BASE
Show details
5
Linguatec Tolosa Treebank ...
BASE
Show details
6
Building a treebank for Occitan: what use for Romance UD corpora?
In: Syntax Fest ; https://hal.archives-ouvertes.fr/hal-02380554 ; Syntax Fest, Aug 2019, Paris, France (2019)
BASE
Show details
7
A Sample French-Serbian Dictionary Entry based on the ParCoLab Parallel Corpus
In: The XVIII EURALEX International Congress: Lexicography in Global Contexts. ; https://hal.archives-ouvertes.fr/hal-01979595 ; The XVIII EURALEX International Congress: Lexicography in Global Contexts., Jul 2018, Ljubljana, Slovenia. pp.423-435 (2018)
BASE
Show details
8
TALC-sef, Un corpus étiqueté de traductions littéraires en serbe, anglais et français
In: ISSN: 2261-2424 ; SHS Web of Conferences ; Congrès Mondial de Linguistique Française ; https://halshs.archives-ouvertes.fr/halshs-01077789 ; Congrès Mondial de Linguistique Française, Jul 2014, Berlin, Allemagne. pp.2551 - 2563, ⟨10.1051/shsconf/20140801035⟩ (2014)
Abstract: International audience ; Le corpus TALC-sef (TAgged Literary Corpus in Serbian, English, French) est un corpus parallèle d'ouvrages littéraires en serbe, anglais et français, étiquetés en parties du discours et librement consultables via une interface en ligne. Il a été constitué par l'Université d'Arras, en collaboration avec l'Université Lille 3 et l'Université de Belgrade, dans une perspective d'études comparées en stylistique et linguistique. Le corpus TALC-sef représente au total plus de 2 millions de mots, il intègre notamment un corpus étiqueté, corrigé manuellement pour la langue serbe, de 150 000 mots. Dans cet article, nous présentons le mode de constitution du corpus parallèle dans son ensemble, puis nous nous attachons plus spécifiquement à l'élaboration du sous-corpus serbe étiqueté. Nous détaillons les choix linguistiques et techniques sous-jacents à la constitution de ce sous-corpus, qui vient compléter l'offre existante pour la linguistique sur corpus en serbe: à ce jour, le seul corpus librement disponible consiste en une traduction du roman 1984 de G. Orwell (100 000 mots), alors que nous proposons un corpus d'œuvres écrites à l'origine en Serbe, de 150 000 mots. La constitution de ce sous-corpus a permis l'élaboration de modèles d'étiquetage automatique pour trois étiqueteurs syntaxiques, dont Treetagger, TnT et BTagger, le plus efficace d'entre eux. Enfin, nous présentons les perspectives d'évolution du corpus existant, en termes d'enrichissement des annotations syntaxiques (analyses en dépendance en parallèle sur les trois langues), ainsi que les apports d'un tel corpus parallèle étiqueté pour la linguistique du français.
Keyword: [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Annotation Morpho-syntaxique; Corpus Parallèles; Serbe
URL: https://halshs.archives-ouvertes.fr/halshs-01077789/document
https://doi.org/10.1051/shsconf/20140801035
https://halshs.archives-ouvertes.fr/halshs-01077789/file/CMLF2014_TALC-sef_15-03-2014.pdf
https://halshs.archives-ouvertes.fr/halshs-01077789
BASE
Hide details
9
TALC-Sef a Manually-revised POS-Tagged Literary Corpus in Serbian, English and French
In: Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14) ; LREC 2014 ; https://halshs.archives-ouvertes.fr/halshs-01077767 ; LREC 2014, May 2014, Reykjavik, Iceland (2014)
BASE
Show details
10
Constitution et annotation syntaxique d'un corpus parallèle français-serbe-anglais
In: Séminaire du laboratoire STL (Lille 3) ; https://halshs.archives-ouvertes.fr/halshs-00990357 ; Séminaire du laboratoire STL (Lille 3), Jun 2013, Lille, France (2013)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
10
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern