DE eng

Search in the Catalogues and Directories

Hits 1 – 4 of 4

1
Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d'une exploitation textométrique : le cas des interrogatives partielles dans ESLO
In: Corpus ; https://halshs.archives-ouvertes.fr/halshs-03133017 ; Corpus, 2021 (2021)
BASE
Show details
2
Using the TEI as a pivot format for oral and multimodal language corpora
In: Text Encoding Initiative Conference and Member's meeting 2015 ; https://halshs.archives-ouvertes.fr/halshs-01345777 ; Text Encoding Initiative Conference and Member's meeting 2015, Oct 2015, Lyon, France ; http://tei2015.huma-num.fr/fr/ (2015)
BASE
Show details
3
Using the TEI as a pivot format for oral and multimodal language corpora
In: Text Encoding Initiative Conference and Member's meeting 2015 ; https://halshs.archives-ouvertes.fr/halshs-01345777 ; Text Encoding Initiative Conference and Member's meeting 2015, Oct 2015, Lyon, France ; http://tei2015.huma-num.fr/fr/ (2015)
BASE
Show details
4
De l'analyse au partage des données, quel(s) format(s) choisir ? L'exemple d'un corpus d'interactions parents-enfant
In: Traitement de corpus (Actes de Coldoc 2012) ; COLDOC 2012 : Traitement de corpus linguistiques ; https://hal.archives-ouvertes.fr/hal-00850172 ; COLDOC 2012 : Traitement de corpus linguistiques, Oct 2012, Paris, France. pp. 128-142 (2012)
Abstract: International audience ; Any project dealing with corpus building will be faced with any array of different challenges. However, amongst these, the choice of the data encoding format will be central. This article describes the processing chain used during the ALIPE project whose aim is to build a corpus of verbal interactions between parents and their young children. In order to put together an organized, structured, documented, open-access resource with maximal interoperability, we selected two encoding formats: CHAT and XML-TEI. In this article, we introduce the methods used by the research team for data collection and annotation and describe how the data was assembled into a corpus. We also discuss the advantages of using the XML format with respect to data analysis as well as interoperability between corpus processing and analysis software. ; Les enjeux inhérents à tout projet de constitution de corpus sont divers mais, parmi ceux-ci, le choix du format d'encodage des données est central. Cet article expose la chaîne de traitement utilisée dans le cadre du projet ALIPE dans le but de constituer un corpus d'interactions orales entre des parents et leur jeune enfant. Afin de constituer une ressource organisée, structurée, documentée, libre d'accès et au maximum interopérable, nous avons retenu deux formats d'encodage : le format CHAT et le format XML-TEI. Nous présentons dans cette étude les méthodes utilisées par l'équipe de recherche pour récolter les données, les annoter et les rassembler dans le but de constituer un corpus. Nous évoquerons également les avantages que l'utilisation du format XML peut apporter pour l'analyse des données ainsi que pour l'interopérabilité entre logiciels de traitement et d'analyse de corpus.
Keyword: [SHS.LANGUE]Humanities and Social Sciences/Linguistics; acquisition; data sharing; interactions parents-enfant; interopérabilité; interoperability; parents-child interactions; partage des données; phonological variation; variation phonologique
URL: https://hal.archives-ouvertes.fr/hal-00850172/file/liegeois_coldoc2012.pdf
https://hal.archives-ouvertes.fr/hal-00850172/document
https://hal.archives-ouvertes.fr/hal-00850172
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
4
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern