1 |
Guidelines for linguistic annotation of modern French (16th-18th c.) ; Manuel d'annotation linguistique pour le français moderne (XVIe -XVIIIe siècles)
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02571190 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
3 |
Étiquetage morphosyntaxique avec SudachiPy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03058361 ; 2020, https://tekipaki.hypotheses.org/721 (2020)
|
|
BASE
|
|
Show details
|
|
4 |
Corpus CALMER : corpus Comparable pour l’étude de l’Acquisition et des Langues : Multilingue, Émotion, Récit
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02886134 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
5 |
Testing, developing and analyzing digital resources within the FLEURON platform ; Expérimentation, amélioration et analyse du dispositif numérique FLEURON
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02610398 ; [Interne] Université de Lorraine. 2020 (2020)
|
|
BASE
|
|
Show details
|
|
6 |
SudachiPy VS spaCy
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03079649 ; 2020, https://tekipaki.hypotheses.org/755 (2020)
|
|
BASE
|
|
Show details
|
|
7 |
Uniformisation d’encodage en deux étapes
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03079596 ; 2020, https://tekipaki.hypotheses.org/669 (2020)
|
|
Abstract:
Tekipaki ; La lecture préalable de l’article Fiabilité de chardet (https://tekipaki.hypotheses.org/536) est fortement conseillée.Lorsqu’on travaille avec un corpus textuel composé de nombreux fichiers dont l’encodage n’est pas uniforme, l’une des premières étapes de traitement est de convertir l’ensemble du corpus vers un encodage unique et reconnu par les outils qui seront utilisés ensuite. Il existe plusieurs façons d’y parvenir, telle que celle présentée dans cet article (https://tekipaki.hypotheses.org/536), qui fait appel à chardet.Toutefois, en fonction de la composition du corpus et des objectifs poursuivis, détecter et convertir en masse l’encodage de l’ensemble des fichiers n’est pas forcément la solution la plus efficace. Voici une alternative où la détection et la conversion constituent deux étapes distinctes.
|
|
Keyword:
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; Corpus; Corpus & linguistique; CSV; Encodage; Python; Python 3; UTF-8
|
|
URL: https://hal.archives-ouvertes.fr/hal-03079596
|
|
BASE
|
|
Hide details
|
|
8 |
L'interrogative en français
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03136590 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
9 |
Étiquetage morphosyntaxique avec Jieba
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://hal.archives-ouvertes.fr/hal-03030765 ; 2020, https://tekipaki.hypotheses.org/115 (2020)
|
|
BASE
|
|
Show details
|
|
10 |
Étiquetage morphosyntaxique avec PyNLPIR
|
|
|
|
In: ISSN: 2729-465X ; Tekipaki ; https://halshs.archives-ouvertes.fr/halshs-03025755 ; 2020, https://tekipaki.hypotheses.org/117 (2020)
|
|
BASE
|
|
Show details
|
|
11 |
CLAPI : étudier l'interaction avec les corpus oraux
|
|
|
|
In: https://halshs.archives-ouvertes.fr/halshs-03083003 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
12 |
La description de contenus audiovisuels. Identifier et décrire les thèmes de discours.
|
|
|
|
In: https://hal-inalco.archives-ouvertes.fr/hal-02516406 ; [Rapport de recherche] 05-06, Institut National des Langues et Civilisations Orientales (INALCO); Fondation Maison des Sciences de l'Homme (FMSH). 2020, pp.20 (2020)
|
|
BASE
|
|
Show details
|
|
13 |
Modèles d’analyse de corpus de données média. ; Modèles d’analyse de corpus de données média.: Rapport réalisé dans le cadre du projet ANR « Campus AAR » (ANR-13-CORD-0016-01).
|
|
|
|
In: https://hal-inalco.archives-ouvertes.fr/hal-02516102 ; [Rapport de recherche] 1, Institut National des Langues et Civilisations Orientales; Fondation Maison des Sciences de l'Homme (FMSH). 2020, pp.116 (2020)
|
|
BASE
|
|
Show details
|
|
14 |
ArbresEtStats
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02512985 ; 2020, ⟨swh:1:dir:a0744b48dd56ca74cbf8f9fb49b4a3f9533622c3;origin=https://hal.archives-ouvertes.fr/hal-02512985;visit=swh:1:snp:80d54e43462bc8e3a7de024649d51f49d931d060;anchor=swh:1:rev:50790d370cc6a7d81f80942cc4c5569a3c58efe1;path=/⟩ (2020)
|
|
BASE
|
|
Show details
|
|
15 |
СЕМАНТИКО-КОНТЕКСТОЛОГИЧЕСКИЙ АНАЛИЗ ЯПОНСКИХ ПРИЛАГАТЕЛЬНЫХ: КОРПУСНЫЙ ПОДХОД ... : SEMANTIC-CONTEXTOLOGICAL ANALYSIS OF JAPANESE ADJECTIVES: CORPUS APPROACH ...
|
|
|
|
BASE
|
|
Show details
|
|
16 |
ComPara: A Corpus Linguistics Dataset of Computation in Architecture ...
|
|
|
|
BASE
|
|
Show details
|
|
17 |
Kazakhstani news corpus for social significance identification with topic modelling results ...
|
|
|
|
BASE
|
|
Show details
|
|
18 |
ComPara: A Corpus Linguistics Dataset of Computation in Architecture ...
|
|
|
|
BASE
|
|
Show details
|
|
20 |
ComPara: A Corpus Linguistics Dataset of Computation in Architecture ...
|
|
|
|
BASE
|
|
Show details
|
|
|
|