1 |
Kittajafr-v2baseline-2.0.1
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
|
|
Abstract:
Description of the kittajafr-v2-2.0.1 ; This guide presents KittajaFr-v2. It is a set of free resources and tools frequently used in machine translation, to build a Transformer model to translate from Japanese into French. The corpus contains 2,5M aligned segments. Score BLEU is between 13,5 et 11,5. ; Ce guide présente le kit kittajafr-v2baseline. Il s'agit d'un ensemble de ressources et d'outils libres couramment utilisés en traduction automatique, permettant d'entraîner un modèle Transformer de traduction neuronale du japonais vers le français. Le corpus contient 2,5M de segments alignés de qualité variable. La segmentation (sentencePiece) du vocabulaire est fixée à 16K mots pour chaque langue et les embeddings sont de 256. Les scores BLEU se situent vers 13,5 et 11,5 (on dispose aussi des scores chrF). Le kittjafr-v2 fait suite à la version v1, qui permettait de construire un très petit modèle (score BLEU 3 et 7).
|
|
Keyword:
[INFO.INFO-OH]Computer Science [cs]/Other [cs.OH]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; French; Japanese; Machine translation; Natural language Processing
|
|
URL: https://hal.archives-ouvertes.fr/hal-03503325
|
|
BASE
|
|
Hide details
|
|
2 |
Kittajafr-v1-1.0.0
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03172321 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
3 |
Kittajafr-v2baseline-2.0.1
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
4 |
ALIGNJaFr_public-v0.8.2
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01847339 ; 2018 (2018)
|
|
BASE
|
|
Show details
|
|
5 |
Automatic Evaluation of Alignments without using a Gold-Corpus ; Automatic Evaluation of Alignments without using a Gold-Corpus: Example with French-Japanese Aligned Corpora
|
|
|
|
In: Conference on Language Resources and Evaluation (LREC 2018) ; https://hal.archives-ouvertes.fr/hal-01789350 ; Conference on Language Resources and Evaluation (LREC 2018), European Language Resources Association (ELRA), May 2018, Miyazaki, Japan ; http://lrec-conf.org (2018)
|
|
BASE
|
|
Show details
|
|
6 |
Understanding of others' knowledge in French and Japanese children: A comparative study with a disambiguation task on 16-38-month-olds
|
|
|
|
In: Infant Behavior & Development ; https://hal.archives-ouvertes.fr/hal-01099820 ; Infant Behavior & Development, 2014, pp.632-643 (2014)
|
|
BASE
|
|
Show details
|
|
7 |
Evaluation des traductions automatiques en français des titres de presse japonais.
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01062005 ; 2014 (2014)
|
|
BASE
|
|
Show details
|
|
|
|