DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5 6 7 8 9...26
Hits 81 – 100 of 512

81
Quality in human post-editing of machine-translated texts : error annotation and linguistic specifications for tackling register errors
Testa, Ingrid. - 2019
Abstract: During the last decade, machine translation has played an important role in the translation market and has become an essential tool for speeding up the translation process and for reducing the time and costs needed. Nevertheless, the quality of the results obtained is not completely satisfactory, as it is considerably variable, depending on numerous factors. Given this, it is necessary to combine MT with human intervention, by post-editing the machine-translated texts, in order to reach high-quality translations. This work aims at describing the MT process provided by Unbabel, a Portuguese start-up that combines MT with post-editing provided by online editors. The main objective of the study is to contribute to improving the quality of the translated text, by analyzing annotated translated texts, from English into Italian, to define linguistic specifications to improve the tools used at the start-up to aid human editors and annotators. The analysis of guidelines provided to the annotator to guide his/her editing process has also been developed, a task that contributed to improve the inter-annotator agreement, thus making the annotated data reliable. Accomplishing these goals allowed for the identification and the categorization of the most frequent errors in translated texts, namely errors whose resolution is bound to significantly improve the efficacy and quality of the translation. The data collected allowed us to identify register as the most frequent error category and also the one with the most impact on the quality of translations, and for these reasons this category is analyzed in more detail along the work. From the analysis of errors in this category, it was possible to define and implement a set of rules in the Smartcheck, a tool used at Unbabel to automatically detect errors in the target text produced by the MT system to guarantee a higher quality of the translated texts after post-edition. ; Nas últimas décadas, a tradução automática tem sido uma importante área de investigação, no âmbito da qual os investigadores têm vindo a conseguir melhorias nos resultados, obtendo mesmo resultados positivos. Hoje em dia, a tradução automática desempenha um papel muito importante no mercado da tradução, devido ao número cada vez maior de textos para traduzir e aos curtos prazos estabelecidos, bem como à pressão constante para se reduzir os custos. Embora a tradução automática seja usada cada vez com mais frequência, os resultados obtidos são variáveis e a qualidade das traduções nem sempre é satisfatória, dependendo dos paradigmas dos sistemas de tradução automática escolhidos, do domínio do texto a traduzir e da sintaxe e do léxico do texto de partida. Mais especificamente, os sistemas de tradução automática que foram desenvolvidos podem ser divididos entre sistemas baseados em conhecimento linguístico, sistemas orientados para os dados e sistemas híbridos, que combinam diferentes paradigmas. Recentemente, o paradigma neuronal tem tido uma aplicação muito expressiva, implicando mesmo a problematização da existência dos restantes paradigmas. Sendo que a qualidade dos resultados de tradução automática depende de diferentes fatores, para a melhorar, é necessário que haja intervenção humana, através de processos de pré-edição ou de pós-edição. Este trabalho parte das atividades desenvolvidas ao longo do estágio curricular na start-up Unbabel, concentrando-se especificamente na análise do processo de tradução automática, implementado na Unbabel, com vista a apresentar um contributo para melhorar a qualidade das traduções obtidas, em particular as traduções de inglês para italiano. A Unbabel é uma start-up portuguesa que oferece serviços de tradução quase em tempo real, combinando tradução automática com uma comunidade de revisores que assegura a pós-edição dos mesmos. O corpus utilizado na realização deste trabalho é composto por traduções automáticas de inglês para italiano, pós-editadas por revisores humanos de e-mails de apoio ao cliente. O processo de anotação visa identificar e categorizar erros em textos traduzidos automaticamente, o que, no contexto da Unbabel, é um processo feito por anotadores humanos. Analisou-se o processo de anotação e as ferramentas que permitem analisar e anotar os textos, o sistema que avalia a métrica de qualidade e as orientações que o anotador tem de seguir no processo de revisão. Este trabalho tornou possível identificar e categorizar os erros mais frequentes nos textos do nosso corpus. Um outro objetivo do presente trabalho consiste em analisar as instâncias dos tipos de erro mais frequentes, para entender quais as causas desta frequência e estabelecer generalizações que permitam elaborar regras suscetíveis de ser implementadas na ferramenta usada na Unbabel, para apoiar o trabalho dos editores e anotadores humanos com notificações automáticas. Em particular, o nosso trabalho foca-se em erros da categoria do registo, o mais frequente nos textos anotados considerados. Mais especificamente, o nosso estudo consiste em definir um conjunto de regras para melhorar a cobertura do Smartcheck, uma ferramenta usada na Unbabel para detetar automaticamente erros em textos traduzidos no âmbito dos fenómenos relacionados com a expressão de registo, para garantir melhores resultados depois do processo de pós-edição. O trabalho apresentado está dividido em oito capítulos. No primeiro capítulo, apresenta-se o objeto de estudo do trabalho, a metodologia usada na sua realização e a organização deste relatório. No segundo capítulo, apresenta-se uma panorâmica teórica sobre a área da tradução automática, sublinhando as características e as finalidades destes sistemas. Apresenta-se uma breve história da tradução automática, desde o surgimento desta área até hoje, bem como os diferentes paradigmas dos sistemas de tradução automática. No terceiro capítulo, apresenta-se a entidade de acolhimento do estágio que serviu de ponto de partida para este trabalho, a start-up portuguesa Unbabel. Explica-se o processo de tradução utilizado na empresa e as fases que o compõem, descrevendo-se detalhadamente os processos de pós-edição e de anotação humanas. São apresentadas também algumas informações sobre as ferramentas usadas na empresa para apoiar o processo de tradução, o Smartcheck e o Turbo Tagger. No quarto capítulo, apresenta-se o processo de anotação desenvolvido na Unbabel, como funciona e as orientações que o anotador deve seguir, descrevendo-se também alguns aspetos que podem ser melhorados. No quinto capítulo problematiza-se a questão do acordo entre anotadores, descrevendo-se a sua importância para medir a homogeneidade entre anotadores e, consequentemente, a fiabilidade de usar os dados de anotação para medir a eficácia e a qualidade dos sistemas de tradução automática. No sexto capítulo, identificam-se os erros mais frequentes por categoria de erro e destaca-se a categoria de registo, a mais frequente e com repercussões evidentes na fluência e na qualidade da tradução, por representar a voz e a imagem do cliente. Apresenta-se uma descrição de um conjunto de regras que pode ser implementado na ferramenta Smartcheck, com vista a diminuir a frequência do erro e aumentar a qualidade dos textos de chegada. Procede-se ainda à verificação do correto funcionamento das regras implementadas, apresentando-se exemplos ilustrativos do desempenho do Smartcheck, na sua versão de teste, com dados relevantes. No último capítulo deste trabalho, apresentam-se as conclusões e o trabalho futuro perspetivado com base neste projeto. Em conclusão, o objetivo do presente trabalho visa contribuir para a melhoria da qualidade dos textos traduzidos na entidade de acolhimento do estágio. Concretamente este trabalho constitui um contributo tangível para o aumento da precisão do processo de anotação humana e para a extensão da cobertura das ferramentas de apoio ao editor e ao anotador humanos usados na start-up Unbabel.
Keyword: Domínio/Área Científica::Humanidades::Línguas e Literaturas; Língua inglesa - Tradução automática; Língua inglesa - Tradução para italiano; Língua italiana - Tradução automática; Teses de mestrado - 2018; Tradução - Metodologia; Tradução automática
URL: http://hdl.handle.net/10451/36289
BASE
Hide details
82
«Like per chi adora like me» : il cyberitaliano dei minorenni in un corpus di commenti su youtube
M. Dota. - : Università degli Studi di Milano, 2019
BASE
Show details
83
La lexicographie de l'italien médiéval et les corpus de l'OVI: un bilan provisoire et quelques nouvelles perspectives
In: Les états anciens des langues à l'heure du numérique. - Paris : Presses de l'Université Paris-Sorbonne (2017), 101-120
BLLDB
Show details
84
I verbi di movimento in italiano lingua seconda: le interlingue dei bambini immigrati nell'area di Napoli
In: Le lingue extra-europee e l’italiano: aspetti didattico-acquisizionali e sociolinguistici ; https://hal.archives-ouvertes.fr/hal-01933802 ; Alberto Manco. Le lingue extra-europee e l’italiano: aspetti didattico-acquisizionali e sociolinguistici, Società di Linguistica Italiana, pp.85-102, 2018, 978-88-97657-25-5 ; http://www.societadilinguisticaitaliana.net/jupgrade/attachments/article/27/[eBook]Atti_SLI_2018.pdf (2018)
BASE
Show details
85
Adaptation d’un roman graphique italien et de sa traduction française pour un lectorat dyslexique
In: ISSN: 0180-684X ; EISSN: 2271-1465 ; Cahiers d'Etudes Romanes ; https://hal-amu.archives-ouvertes.fr/hal-02119338 ; Cahiers d'Etudes Romanes, Centre aixois d'études romanes, 2018, Le roman graphique en langues romanes, pp.79-91. ⟨10.4000/etudesromanes.7903⟩ ; https://journals.openedition.org (2018)
BASE
Show details
86
Bambine e ragazzi bilingui nelle classi multietniche di Torino
Ritucci, Raffaella. - : Humboldt-Universität zu Berlin, 2018
BASE
Show details
87
Las reformas de la ortografía en los diccionarios bilingües de italiano-español de los siglos XIX, XX y XXI ...
Hériz, Ana Lourdes. - : Zenodo, 2018
BASE
Show details
88
Las reformas de la ortografía en los diccionarios bilingües de italiano-español de los siglos XIX, XX y XXI ...
Hériz, Ana Lourdes. - : Zenodo, 2018
BASE
Show details
89
La expresión de la modalidad continuativa: estudio sobre la interlengua en estudiantes de italiano LE con LM castellana o catalanocastellana y propuestas didácticas contrastivas
Ambrosini, Maria Vittoria. - : Universitat Autònoma de Barcelona, 2018
In: TDX (Tesis Doctorals en Xarxa) (2018)
BASE
Show details
90
Il Sommo Topolino nella selva oscura : spunti per una lettura linguistica de L'Inferno di Topolino
BASE
Show details
91
Il lessico piemontese nel dizionario di Lucio Ambruzzi : tra dialetto e italiano standard
BASE
Show details
92
Translating Poetics of Place, Memory and Identity: An Exploration of Ignazio Buttitta’s Sicilian Dialect Poetry in English
BASE
Show details
93
Las unidades fraseológicas en la enseñanza de una lengua extranjera (italiano - español) ; A Teaching Approach to Phraseological Units (Italian – Spanish)
Lisciandro, Rosario. - : Universidad de Córdoba, UCOPress, 2018
BASE
Show details
94
Ordini marcati delle parole nell'italiano scritto: apprendenti germanofoni, apprendenti anglofoni e parlanti nativi a confronto
Valentini, Ada. - 2018
BASE
Show details
95
I verbi sintagmatici italiani nei dizionari bilingui italiano-spagnolo : microstruttura, macrostruttura e traducenti
Artusi, Andrea. - 2018
BASE
Show details
96
Dialectos italianos - Italiano: lengua románica conservadora
Menéndez Pidal, Ramón (1869-1968). - 2018
BASE
Show details
97
Herramientas lexicográficas en el aula de italiano L2
BASE
Show details
98
Carácter general de los principales romances - Invariabilidad del italiano y transfromación del francés
Menéndez Pidal, Ramón (1869-1968). - 2018
BASE
Show details
99
Morfologia italiana in alcuni strumenti lessicografici friulani
Roseano, Paolo. - 2018
BASE
Show details
100
LA MITIGAZIONE NELLA PROSA SCIENTIFICO-ACCADEMICA ITALIANA E NELLA PROSPETTIVA DELL'INSEGNAMENTO DELL'ITALIANO LS.
GIORDANO, CARLO. - : Università Cattolica del Sacro Cuore, 2018. : MILANO, 2018
BASE
Show details

Page: 1 2 3 4 5 6 7 8 9...26

Catalogues
14
0
5
0
0
1
0
Bibliographies
111
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
399
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern