1 |
Automatic Normalisation of Early Modern French
|
|
|
|
In: https://hal.inria.fr/hal-03540226 ; 2022 (2022)
|
|
BASE
|
|
Show details
|
|
2 |
From FreEM to D'AlemBERT ; From FreEM to D'AlemBERT: a Large Corpus and a Language Model for Early Modern French
|
|
|
|
In: Proceedings of the 13th Language Resources and Evaluation Conference ; https://hal.inria.fr/hal-03596653 ; Proceedings of the 13th Language Resources and Evaluation Conference, European Language Resources Association, Jun 2022, Marseille, France (2022)
|
|
BASE
|
|
Show details
|
|
3 |
A dataset for automatic detection of places in (early) modern French texts ; Un jeu de données pour la détection automatique de lieux dans les textes français modernes
|
|
|
|
In: NASSCFL 2021 - 50th Annual North American Society for Seventeenth-Century French Literature Conference ; https://hal.archives-ouvertes.fr/hal-03187097 ; NASSCFL 2021 - 50th Annual North American Society for Seventeenth-Century French Literature Conference, NASSCFL, May 2021, Iowa City / Virtual, United States. pp.5 (2021)
|
|
BASE
|
|
Show details
|
|
4 |
Éditer le Grand Siècle au XIX e s. Remarques sur les choix (ortho)graphiques de quelques éditeurs
|
|
|
|
In: Actes du XXIXe Congrès international de linguistique et de philologie romanes ; https://hal.archives-ouvertes.fr/hal-01907239 ; Actes du XXIXe Congrès international de linguistique et de philologie romanes, 1, Éditions de linguistique et de philologie, pp.1555-1568, 2021, 978-2-37276-050-8 ; https://www.slir.org/cilpr/cilpr-2019-copenhague/ (2021)
|
|
BASE
|
|
Show details
|
|
5 |
Lemmatiser des textes et corriger l'annotation grâcè a l'apprentissage profond avec Pyrrha
|
|
|
|
In: Humanistica 2021 ; https://hal.archives-ouvertes.fr/hal-03224112 ; Humanistica 2021, May 2021, Rennes, France (2021)
|
|
BASE
|
|
Show details
|
|
6 |
Variation graphique dans les documents d'Ancien Régime : Nouvelles approches scriptométriques
|
|
|
|
In: Journée d’étude : « Pour une histoire de la langue ‘par en bas’: textes privés et variation des langues dans le passé » ; https://hal.inria.fr/hal-03357080 ; Journée d’étude : « Pour une histoire de la langue ‘par en bas’: textes privés et variation des langues dans le passé », Sep 2021, Paris, France (2021)
|
|
BASE
|
|
Show details
|
|
7 |
Corpus and Models for Lemmatisation and POS-tagging of Classical French Theatre
|
|
|
|
In: EISSN: 2416-5999 ; Journal of Data Mining and Digital Humanities ; https://halshs.archives-ouvertes.fr/halshs-02591388 ; Journal of Data Mining and Digital Humanities, Episciences.org, 2021, ⟨10.46298/jdmdh.6485⟩ (2021)
|
|
BASE
|
|
Show details
|
|
8 |
Beyond Idiolectometry? On Racine's Stylometric Signature ; Au-delà de l'idiolectométrie? Sur la signature stylométrique de Racine
|
|
|
|
In: Proceedings of the Conference on Computational Humanities Research 2021 ; Conference on Computational Humanities Research 2021 ; https://hal.archives-ouvertes.fr/hal-03402994 ; Conference on Computational Humanities Research 2021, Nov 2021, Amsterdam, Netherlands ; http://ceur-ws.org/Vol-2989 (2021)
|
|
BASE
|
|
Show details
|
|
9 |
Expanding the content model of annotationBlock
|
|
|
|
In: Next Gen TEI, 2021 - TEI Conference and Members’ Meeting ; https://hal.archives-ouvertes.fr/hal-03380805 ; Next Gen TEI, 2021 - TEI Conference and Members’ Meeting, Oct 2021, Virtual, United States (2021)
|
|
BASE
|
|
Show details
|
|
10 |
SegmOnto ; SegmOnto: Un vocabulaire contrôlé pour décrire la page manuscrite et imprimée
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03481089 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
11 |
Guidelines for linguistic annotation of modern French (16th-18th c.) ; Manuel d'annotation linguistique pour le français moderne (XVIe -XVIIIe siècles)
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-02571190 ; 2020 (2020)
|
|
BASE
|
|
Show details
|
|
12 |
Standardizing linguistic data: method and tools for annotating (pre-orthographic) French ; Standardiser les données linguistiques: méthodes et outils pour l'annotation du français (pré-orthographique)
|
|
|
|
In: Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20) ; https://hal.archives-ouvertes.fr/hal-03018381 ; Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC '20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3423996⟩ (2020)
|
|
BASE
|
|
Show details
|
|
13 |
Machine Translation for the Normalisation of 17th c. French ; Traduction automatique pour la normalisation du français du XVII e siècle
|
|
|
|
In: TALN 2020 ; https://hal.archives-ouvertes.fr/hal-02596669 ; TALN 2020, ATALA, Jun 2020, Nancy, France (2020)
|
|
Abstract:
International audience ; The study of old state of languages is facing a double problem : on the one hand the distance with contemporary spelling prevents scholars from using standard NLP solutions, on the other hand the instability of the scriptae complexifies the training of solutions directly on the original source text. Returning to this problem with a DH perspective, we start with the philological reasoning behind the creation of the training corpus, and use traditional NLP methods to compare two machine translation systems (statistical and neural) and offer a functional tool for the normalisation of 17th c. French answering the needs of philologists. Mots-clés : Normalisation, XVII e siècle, traduction automatique neuronale, traduction automa-tique statistique, humanités numériques. ; L'étude des états de langue anciens se heurte à un double problème : d'une part la distance d'avec l'orthographe actuelle, qui empêche de recourir aux solutions standards de TAL, et d'autre part l'in-stabilité des systèmes graphiques, qui complexifie l'entraînement de solutions directement sur le texte original. Reprenant ce problème d'un point de vue des humanités numériques, nous partons du raisonnement philologique qui sous-tend la création du corpus d'entraînement, avant de recourir aux méthodes traditionnelles de TAL pour comparer deux systèmes de traduction automatique (sta-tistique et neuronale) et offrir un outil fonctionnel pour la normalisation du français classique qui corresponde aux besoins des philologues.
|
|
Keyword:
17th c French; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; [SHS.LITT]Humanities and Social Sciences/Literature; Digital humanities; Français classique; Humanités numériques; Neural Machine Translation (NMT); Normalisation; Statistical Machine Translation (SMT); Traduction automatique neuronale; Traduction automatique statistique
|
|
URL: https://hal.archives-ouvertes.fr/hal-02596669/file/main.pdf https://hal.archives-ouvertes.fr/hal-02596669 https://hal.archives-ouvertes.fr/hal-02596669/document
|
|
BASE
|
|
Hide details
|
|
14 |
A linguistic introduction for machine learning data? ; Une introduction linguistique pour les données de Machine learning?
|
|
|
|
In: Humanistica 2020 ; https://hal.archives-ouvertes.fr/hal-02619356 ; Humanistica 2020, Humanistica, May 2020, Bordeaux, France ; http://www.humanisti.ca/colloque2020/ (2020)
|
|
BASE
|
|
Show details
|
|
15 |
La naissance de Marie-Blanche de Grignan. Notes sur la mise en page de la polyphonie sévignéenne
|
|
|
|
In: ISSN: 2496-5731 ; Acta Litt&Arts [En ligne] ; https://hal.archives-ouvertes.fr/hal-01900042 ; Acta Litt&Arts [En ligne], Grenoble: Université Grenoble Alpes, 2020, Les discours rapportés en contexte épistolaire (XVIe-XVIIIe siècles), http://ouvroir-litt-arts.univ-grenoble-alpes.fr/revues/actalittarts/616 (2020)
|
|
BASE
|
|
Show details
|
|
16 |
CORPUS17: a philological corpus for 17th c. French ; CORPUS17: un corpus philologique pour le 17ème siècle français
|
|
|
|
In: Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20) ; https://hal.archives-ouvertes.fr/hal-03041871 ; Proceedings of the 2nd International Digital Tools & Uses Congress (DTUC ’20), Oct 2020, Hammamet, Tunisia. ⟨10.1145/3423603.3424002⟩ (2020)
|
|
BASE
|
|
Show details
|
|
17 |
Standardizing linguistic data: method and tools for annotating (pre-orthographic) French ...
|
|
|
|
BASE
|
|
Show details
|
|
18 |
Standardizing linguistic data: method and tools for annotating(pre-orthographic) French ...
|
|
|
|
BASE
|
|
Show details
|
|
19 |
Standardizing linguistic data: method and tools for annotating(pre-orthographic) French ...
|
|
|
|
BASE
|
|
Show details
|
|
20 |
Éditer le Grand Siècle au XVIIIe s. Remarques sur les choix (ortho)graphiques de quelques éditeurs
|
|
|
|
In: Book Practices & Textual Itineraries ; https://hal.archives-ouvertes.fr/hal-01900036 ; Book Practices & Textual Itineraries, PUN, 2019, Habillage du livre et du texte aux XVII et XVIII siècles, 9, pp.133-148 (2019)
|
|
BASE
|
|
Show details
|
|
|
|