1 |
Kittajafr-v2baseline-2.0.1
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
|
|
Abstract:
Description of the kittajafr-v2-2.0.1 ; This guide presents KittajaFr-v2. It is a set of free resources and tools frequently used in machine translation, to build a Transformer model to translate from Japanese into French. The corpus contains 2,5M aligned segments. Score BLEU is between 13,5 et 11,5. ; Ce guide présente le kit kittajafr-v2baseline. Il s'agit d'un ensemble de ressources et d'outils libres couramment utilisés en traduction automatique, permettant d'entraîner un modèle Transformer de traduction neuronale du japonais vers le français. Le corpus contient 2,5M de segments alignés de qualité variable. La segmentation (sentencePiece) du vocabulaire est fixée à 16K mots pour chaque langue et les embeddings sont de 256. Les scores BLEU se situent vers 13,5 et 11,5 (on dispose aussi des scores chrF). Le kittjafr-v2 fait suite à la version v1, qui permettait de construire un très petit modèle (score BLEU 3 et 7).
|
|
Keyword:
[INFO.INFO-OH]Computer Science [cs]/Other [cs.OH]; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; French; Japanese; Machine translation; Natural language Processing
|
|
URL: https://hal.archives-ouvertes.fr/hal-03503325
|
|
BASE
|
|
Hide details
|
|
2 |
Kittajafr-v1-1.0.0
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03172321 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
3 |
Kittajafr-v2baseline-2.0.1
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-03503325 ; 2021 (2021)
|
|
BASE
|
|
Show details
|
|
4 |
ALIGNJaFr_public-v0.8.2
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01847339 ; 2018 (2018)
|
|
BASE
|
|
Show details
|
|
5 |
Automatic Evaluation of Alignments without using a Gold-Corpus ; Automatic Evaluation of Alignments without using a Gold-Corpus: Example with French-Japanese Aligned Corpora
|
|
|
|
In: Conference on Language Resources and Evaluation (LREC 2018) ; https://hal.archives-ouvertes.fr/hal-01789350 ; Conference on Language Resources and Evaluation (LREC 2018), European Language Resources Association (ELRA), May 2018, Miyazaki, Japan ; http://lrec-conf.org (2018)
|
|
BASE
|
|
Show details
|
|
6 |
A lexicometric analysis of the Japanese novel kokoro (Natsume Soseki) ; Analyse lexicométrique du roman japonais kokoro (« Le pauvre coeur des hommes ») de Natsume Soseki
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01473996 ; 2017 (2017)
|
|
BASE
|
|
Show details
|
|
7 |
A lexicometric analysis of the Japanese novel kokoro (Natsume Soseki) ; Analyse lexicométrique du roman japonais kokoro (« Le pauvre coeur des hommes ») de Natsume Soseki
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01473996 ; 2017 (2017)
|
|
BASE
|
|
Show details
|
|
8 |
Semantics of the Sino-Japanese derived noun ' verbal noun + sha (“person”) '
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01571625 ; 2017 (2017)
|
|
BASE
|
|
Show details
|
|
9 |
The nominal prefix in Japanese 元 moto- ("ex-") ; Noms japonais préfixables de 元 moto-(« ex-, ancien-») ; 日本語の接頭辞『元」
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01279394 ; 2016 (2016)
|
|
BASE
|
|
Show details
|
|
10 |
JaLexGram v-0.14 Lexic and Grammar for Japanese ; JaLexGram v-0.14 Lexique Grammaire du Japonais
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01383651 ; 2016 (2016)
|
|
BASE
|
|
Show details
|
|
11 |
The nominal prefix in Japanese 元 moto- ("ex-") ; Noms japonais préfixables de 元 moto-(« ex-, ancien-») ; 日本語の接頭辞『元」
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01279394 ; 2016 (2016)
|
|
BASE
|
|
Show details
|
|
12 |
Frequency of the passive form of Japanese verbal nouns ; Fréquence de la forme passive des noms verbaux japonais
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01161792 ; 2015 (2015)
|
|
BASE
|
|
Show details
|
|
13 |
Frequency of the passive form of Japanese verbal nouns ; Fréquence de la forme passive des noms verbaux japonais
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01161792 ; 2015 (2015)
|
|
BASE
|
|
Show details
|
|
14 |
Comparaison de deux outils d'analyse de corpus japonais pour l'aide au linguiste, Sagace et MeCab
|
|
|
|
In: Actes TALN-RECITAL 2014 ; Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01054370 ; Traitement Automatique des Langues Naturelles, 2014, Marseilles, France. pp.497 (2014)
|
|
BASE
|
|
Show details
|
|
15 |
Comparaison des temps de traitement de corpus en japonais par Sagace et un système basé sur MeCab
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01054409 ; 2014 (2014)
|
|
BASE
|
|
Show details
|
|
16 |
Understanding of others' knowledge in French and Japanese children: A comparative study with a disambiguation task on 16-38-month-olds
|
|
|
|
In: Infant Behavior & Development ; https://hal.archives-ouvertes.fr/hal-01099820 ; Infant Behavior & Development, 2014, pp.632-643 (2014)
|
|
BASE
|
|
Show details
|
|
17 |
Comparaison de deux outils d'analyse de corpus japonais pour l'aide au linguiste, Sagace et MeCab
|
|
|
|
In: Actes TALN-RECITAL 2014 ; Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-01054370 ; Traitement Automatique des Langues Naturelles, 2014, Marseilles, France. pp.497 (2014)
|
|
BASE
|
|
Show details
|
|
18 |
Comparaison des temps de traitement de corpus en japonais par Sagace et un système basé sur MeCab
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01054409 ; 2014 (2014)
|
|
BASE
|
|
Show details
|
|
19 |
Evaluation des traductions automatiques en français des titres de presse japonais.
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-01062005 ; 2014 (2014)
|
|
BASE
|
|
Show details
|
|
20 |
Glossaire japonais-français de linguistique japonaise et linguistique générale
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-00870480 ; 2013 (2013)
|
|
BASE
|
|
Show details
|
|
|
|