DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4
Hits 1 – 20 of 78

1
The Role of human reference translation in machine translation evaluation
Fomicheva, Marina. - : Universitat Pompeu Fabra, 2017
In: TDX (Tesis Doctorals en Xarxa) (2017)
Abstract: Both manual and automatic methods for Machine Translation (MT) evaluation heavily rely on professional human translation. In manual evaluation, human translation is often used instead of the source text in order to avoid the need for bilingual speakers, whereas the majority of automatic evaluation techniques measure string similarity between MT output and a human translation (commonly referred to as candidate and reference translations), assuming that the closer they are, the higher the MT quality. In spite of the crucial role of human reference translation in the assessment of MT quality, its fundamental characteristics have been largely disregarded. An inherent property of professional translation is the adaptation of the original text to the expectations of the target audience. As a consequence, human translation can be rather different from the original text, which, as will be shown throughout this work, has a strong impact on the results of MT evaluation. The first goal of our research was to assess the effects of using human translation as a benchmark for MT evaluation. To achieve this goal, we started with a theoretical discussion of the relation between original and translated texts. We identified the presence of optional translation shifts as one of the fundamental characteristics of human translation. We analyzed the impact of translation shifts on automatic and manual MT evaluation showing that in both cases quality assessment is strongly biased by the reference provided. The second goal of our work was to improve the accuracy of automatic evaluation in terms of the correlation with human judgments. Given the limitations of reference-based evaluation discussed in the first part of the work, instead of considering different aspects of similarity we focused on the differences between MT output and reference translation searching for criteria that would allow distinguishing between acceptable linguistic variation and deviations induced by MT errors. In the first place, we explored the use of local syntactic context for validating the matches between candidate and reference words. In the second place, to compensate for the lack of information regarding the MT segments for which no counterpart in the reference translation was found, we enhanced reference-based evaluation with fluency-oriented features. We implemented our approach as a family of automatic evaluation metrics that showed highly competitive performance in a series of well-known MT evaluation campaigns. ; Tanto los métodos manuales como los automáticos para la evaluación de la Traducción Automática (TA) dependen en gran medida de la traducción humana profesional. En la evaluación manual, la traducción humana se utiliza a menudo en lugar del texto original para evitar la necesidad de hablantes bilingües, mientras que la mayoría de las técnicas de evaluación automática miden la similitud entre la TA y una traducción humana (comúnmente llamadas traducción candidato y traducción de referencia), asumiendo que cuanto más cerca están, mayor es la calidad de la TA. A pesar del papel fundamental que juega la traducción de referencia en la evaluación de la calidad de la TA, sus características han sido en gran parte ignoradas. Una propiedad inherente de la traducción profesional es la adaptación del texto original a las expectativas del lector. Como consecuencia, la traducción humana puede ser bastante diferente del texto original, lo cual, como se demostrará a lo largo de este trabajo, tiene un fuerte impacto en los resultados de la evaluación de la TA. El primer objetivo de nuestra investigación fue evaluar los efectos del uso de la traducción humana como punto de referencia para la evaluación de la TA. Para lograr este objetivo, comenzamos con una discusión teórica sobre la relación entre textos originales y traducidos. Se identificó la presencia de cambios de traducción opcionales como una de las características fundamentales de la traducción humana. Se analizó el impacto de estos cambios en la evaluación automática y manual de la TA demostrándose en ambos casos que la evaluación está fuertemente sesgada por la referencia proporcionada. El segundo objetivo de nuestro trabajo fue mejorar la precisión de la evaluación automática medida en términos de correlación con los juicios humanos. Dadas las limitaciones de la evaluación basada en la referencia discutidas en la primera parte del trabajo, en lugar de enfocarnos en la similitud, nos concentramos en el impacto de las diferencias entre la TA y la traducción de referencia buscando criterios que permitiesen distinguir entre variación lingüística aceptable y desviaciones inducidas por los errores de TA. En primer lugar, exploramos el uso del contexto sintáctico local para validar las coincidencias entre palabras candidato y de referencia. En segundo lugar, para compensar la falta de información sobre los segmentos de la TA para los cuales no se encontró ninguna relación con la traducción de referencia, introdujimos características orientadas a la fluidez de la TA en la evaluación basada en la referencia. Implementamos nuestro enfoque como una familia de métricas de evaluación automática que mostraron un rendimiento altamente competitivo en una serie de conocidas campañas de evaluación de la TA.
Keyword: 81; Alineamiento monolingüe; Automatic evaluation; Calidad de la traducción automática; Distributional similarity; Equivalencia traductora; Errores de traducción; Estimación de calidad; Estudios de traducción; Evaluación automática; Evaluación de la traducción automática; Machine translation; Machine translation evaluation; Machine translation quality; Monolingual alignment; Quality estimation; Similitud distribucional; Statistical machine translation; Traducción automática; Traducción automática estadística; Translation equivalence; Translation errors; Translation shifts; Translation studies; Translationese
URL: http://hdl.handle.net/10803/404987
BASE
Hide details
2
Phrase table expansion for statistical machine translation with reduced parallel corpora: the Chinese-Spanish case
Han, Jingyi. - : Universitat Pompeu Fabra, 2017
In: TDX (Tesis Doctorals en Xarxa) (2017)
BASE
Show details
3
Pattern-based automatic induction of domain adapted resources for social media analysis
Vázquez Suárez, Silvia. - : Universitat Pompeu Fabra, 2016
In: TDX (Tesis Doctorals en Xarxa) (2016)
BASE
Show details
4
Verb SCF extraction for Spanish with dependency parsing ; Extracción de patrones de subcategorización de verbos en castellano con análisis de dependencias
Padró Cirera, Montserrat; Garí, Aina; Bel Rafecas, Núria. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2013
BASE
Show details
5
Annotation of regular polysemy: an empirical assessment of the underspecified sense
Martínez Alonso, Héctor. - : Universitat Pompeu Fabra, 2013
In: TDX (Tesis Doctorals en Xarxa) (2013)
BASE
Show details
6
METANET4U: enhancing the European linguistic infrastructure ; METANET4U: aumentar la infraestructura lingüística europea
Bel Rafecas, Núria; Moreno Bilbao, María Asunción. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2012
BASE
Show details
7
Los Nombres eventivos no deverbales en español
Resnik, Gabriela. - : Universitat Pompeu Fabra, 2011
In: TDX (Tesis Doctorals en Xarxa) (2011)
BASE
Show details
8
FLaReNet: una red para fomentar los recursos lingüísticos ; Fostering language resources network: FLaReNet
Bel Rafecas, Núria; Calzolari, Nicoletta. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2009
BASE
Show details
9
El Proyecto CLARIN: Una infraestructura de investigación científica para las Humanidades y las Ciencias Sociales
Bel Rafecas, Núria; Bel, Santiago; Espeja, Sergio. - : Universitat Oberta de Catalunya, 2008
BASE
Show details
10
An open-source lexicon for Spanish
Marimon Felipe, Montserrat; Seghezzi, Natalia Andrea; Bel Rafecas, Núria. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2007
BASE
Show details
11
El Léxico PAROLE del español
Villegas Montserrat, Marta; Brosa, Isabel; Bel Rafecas, Núria. - : Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), 1998
BASE
Show details
12
Handling of missing values in lexical acquisition
Bel Rafecas, Núria. - : ACL (Association for Computational Linguistics)
BASE
Show details
13
Choosing which to use? A study of distributional models for nominal lexical semantic classification
Romeo, Lauren; Lebani, Gianluca E.; Bel Rafecas, Núria. - : ACL (Association for Computational Linguistics)
BASE
Show details
14
The Spanish resource grammar: pre-processing strategy and lexical acquisition
Marimon, Montserrat; Bel Rafecas, Núria; Espeja, Sergio. - : ACL (Association for Computational Linguistics)
BASE
Show details
15
Towards the automatic classification of complex-type nominals
Romeo, Lauren; Mendes, Sara; Bel Rafecas, Núria. - : ACL (Association for Computational Linguistics)
BASE
Show details
16
A cascade approach for complex-type classification
Romeo, Lauren; Mendes, Sara; Bel Rafecas, Núria. - : ACL (Association for Computational Linguistics)
BASE
Show details
17
Lexical entry templates for robust deep parsing
Marimon, Montserrat; Bel Rafecas, Núria. - : ACL (Association for Computational Linguistics)
BASE
Show details
18
Mining and exploiting domain-specific corpora in the PANACEA platform
Bel Rafecas, Núria; Prokopidis, Prokopis; Toral, Antonio. - : ELRA (European Language Resources Association)
BASE
Show details
19
Cross-lingual text categorization
BASE
Show details
20
Automatic Lexical Semantic Classification of Nouns
Padró, Muntsa; Bel Rafecas, Núria; Romeo, Lauren. - : ELRA (European Language Resources Association)
BASE
Show details

Page: 1 2 3 4

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
78
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern