2 |
De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire
|
|
|
|
Abstract:
Nous présentons notre approche fondée sur les données authentiques, en nous concentrant sur des recherches récentes, portant sur le recueil, le traitement et l’analyse d’un grand corpus de SMS en français, intitulé 88milSMS (http://88milsms. huma-num.fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), incluant un questionnaire sociolinguistique soumis aux donateurs au moment de la collecte ainsi que leurs réponses. Puis nous expliquons pourquoi, dans une démarche pluridisciplinaire (située entre sciences du langage, informatique et traitement automatique du langage naturel), nous avons décidé de fournir à la communauté scientifique et au grand public le corpus de SMS. ; This article highlights an approach based on authentic data, by focusing on recent research related to collection, processing and analysis of a large French text-message corpus, entitled 88milSMS (http://88milsms.huma-num.fr/, Panckhurst, Détrie, Lopez, Moïse, Roche, Verine, 2014), including a sociolinguistic questionnaire submitted to donors (with their answers). The authors, using a pluridisciplinary approach (linguistics/ language sciences, computer science, Natural Language Processing), explain why they chose to give the scientific community and the general public access to the SMS corpus. ; Panckhurst Rachel, Roche Mathieu, Lopez Cédric, Verine Bertrand, Détrie Catherine, Moïse Claudine. De la collecte à l’analyse d’un corpus de SMS authentiques : une démarche pluridisciplinaire. In: Histoire Épistémologie Langage, tome 38, fascicule 2, 2016. Constitution de corpus linguistiques et pérennisation des données. pp. 73-85.
|
|
Keyword:
alignement; alignment; anonymisation software; authentic data; Corpus; dictionnaires électroniques; discours électronique médié; données authentiques; electronic dictionaries; logiciel d’anonymisation; mediated electronic discourse; natural language processing (NLP); pluridisciplinarité; pluridisciplinarity; SMS; traitement automatique du langage naturel (TALN)
|
|
URL: https://www.persee.fr/doc/hel_0750-8069_2016_num_38_2_3562 https://doi.org/10.1051/hel/2016380206
|
|
BASE
|
|
Hide details
|
|
3 |
Dites-le dans le français que vous voulez ! ; Dites-le dans le français que vous voulez !: Les invités de Mediapart, 2 avril 2015
|
|
|
|
In: ISSN: 2100-0735 ; Mediapart ; https://hal.archives-ouvertes.fr/hal-01487064 ; Mediapart, Paris (8 passage Brulon ; 75012) : Société éditrice de Mediapart, 2008-, 2015 ; https://blogs.mediapart.fr/edition/les-invites-de-mediapart/article/020415/dites-le-dans-le-francais-que-vous-voulez (2015)
|
|
BASE
|
|
Show details
|
|
4 |
Une grande collecte de SMS authentiques en français : démarche, remarques et conseils
|
|
|
|
In: ISSN: 1017-1150 ; EISSN: 1560-5957 ; Le français à l'université ; https://hal-lirmm.ccsd.cnrs.fr/lirmm-01068084 ; Le français à l'université, Agence universitaire de la Francophonie, 2014, 19 (3) ; http://www.bulletin.auf.org/index.php?id=1865 (2014)
|
|
BASE
|
|
Show details
|
|
5 |
Un grand corpus de SMS en français : 88milSMS
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01068727 ; 2014, pp.22-25 (2014)
|
|
BASE
|
|
Show details
|
|
6 |
Sud4science, de l'acquisition d'un grand corpus de SMS en français à l'analyse de l'écriture SMS
|
|
|
|
In: ISSN: 1742-3600 ; EISSN: 1750-0117 ; Episteme ; https://hal.archives-ouvertes.fr/hal-00923618 ; Episteme, Cambridge University Press (CUP), 2013, Communication électronique et écritures numériques, 9 (9), pp.107-138 (2013)
|
|
BASE
|
|
Show details
|
|
7 |
L' actualisation de l'intersubjectivité: de la langue au discours : textes réunis et présentés par Bertrand Vérine et Catherine Détrie en hommage à Jeanne-Marie Barbéris
|
|
|
|
BLLDB
|
|
UB Frankfurt Linguistik
|
|
Show details
|
|
8 |
Egogenèse et textualisation ; Egogenèse et textualisation: l’apport de Jeanne-Marie Barbéris
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03050865 ; Bertrand Verine; Catherine Détrie. Lambert-Lucas, 191 p., 2011 (2011)
|
|
BASE
|
|
Show details
|
|
9 |
sud4science Languedoc-Roussillon. Mutation des pratiques scripturales en communication électronique médiée.
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-00702420 ; 2011, http://www.sud4science.org, http://www.msh-m.fr/programmes-2011/sud4science-lr/ (2011)
|
|
BASE
|
|
Show details
|
|
10 |
Quand l'interpellation interpelle les linguistes ; Quand l'interpellation interpelle les linguistes: l'activité interpellative, un "objet de recherche difficile à cerner" ?
|
|
|
|
In: ISSN: 1638-5748 ; EISSN: 1638-573X ; CORELA - COgnition, REprésentation, LAngage ; https://hal.archives-ouvertes.fr/hal-03061185 ; CORELA - COgnition, REprésentation, LAngage, CERLICO-Cercle Linguistique du Centre et de l'Ouest (France), 2010, N° thématique (2010)
|
|
BASE
|
|
Show details
|
|
11 |
"Ô, entre langue(s), discours et graphie": compte rendu
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-00437917 ; 2010 (2010)
|
|
BASE
|
|
Show details
|
|
14 |
"Antoine Culioli, un homme dans le langage": compte rendu
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-00437911 ; 2009 (2009)
|
|
BASE
|
|
Show details
|
|
15 |
L'allogénèse entre données linguistiques et données interactionnelles
|
|
|
|
In: L'allogénèse entre données linguistiques et données interactionnelles ; Journée d'étude en hommage scientifique à Jeanne-Marie Barbéris, Praxiling, Université Paul Valéry-Montpellier 3 ; https://hal.archives-ouvertes.fr/hal-03074199 ; Journée d'étude en hommage scientifique à Jeanne-Marie Barbéris, Praxiling, Université Paul Valéry-Montpellier 3, 2009, Montpellier, France (2009)
|
|
BASE
|
|
Show details
|
|
16 |
De la construction intersubjective à la connivence ; De la construction intersubjective à la connivence: la relation interpersonnelle dans "le 7-10" de France-Inter
|
|
|
|
In: De la construction intersubjective à la connivence ; "Conference on Grammar and Text - GRATO", colloque international, Lisbonne, 2-4 juillet 2009 ; https://hal.archives-ouvertes.fr/hal-03071984 ; "Conference on Grammar and Text - GRATO", colloque international, Lisbonne, 2-4 juillet 2009, 2009, Lisbonne, Portugal (2009)
|
|
BASE
|
|
Show details
|
|
17 |
L'énallage : une opération de commutation grammaticale et/ou de disjonction énonciative ?
|
|
|
|
In: Langue française, n 160, 4, 2008-12-01, pp.89-104 (2008)
|
|
BASE
|
|
Show details
|
|
|
|