DE eng

Search in the Catalogues and Directories

Hits 1 – 3 of 3

1
Kittajafr-v2baseline-2.0.1
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
BASE
Show details
2
Kittajafr-v1-1.0.0
In: https://hal.archives-ouvertes.fr/hal-03172321 ; 2021 (2021)
BASE
Show details
3
Kittajafr-v2baseline-2.0.1
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
Abstract: Description of the kittajafr-v2-2.0.1 ; This guide presents KittajaFr-v2. It is a set of free resources and tools frequently used in machine translation, to build a Transformer model to translate from Japanese into French. The corpus contains 2,5M aligned segments. Score BLEU is between 13,5 et 11,5. ; Ce guide présente le kit kittajafr-v2baseline. Il s'agit d'un ensemble de ressources et d'outils libres couramment utilisés en traduction automatique, permettant d'entraîner un modèle Transformer de traduction neuronale du japonais vers le français. Le corpus contient 2,5M de segments alignés de qualité variable. La segmentation (sentencePiece) du vocabulaire est fixée à 16K mots pour chaque langue et les embeddings sont de 256. Les scores BLEU se situent vers 13,5 et 11,5 (on dispose aussi des scores chrF). Le kittjafr-v2 fait suite à la version v1, qui permettait de construire un très petit modèle (score BLEU 3 et 7).
Keyword: [INFO.INFO-OH]Computer Science [cs]/Other [cs.OH]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; French; Japanese; Machine translation; Natural language Processing
URL: https://hal.archives-ouvertes.fr/hal-03503325
BASE
Hide details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
3
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern