DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...19
Hits 1 – 20 of 373

1
Maschinelle Übersetzung (MT) für den Notfall : Ratgeber zum Einsatz von MT Tools für die Kommunikation mit Flüchtlingen aus der Ukraine ...
Delorme Benites, Alice. - : ZHAW Zürcher Hochschule für Angewandte Wissenschaften, 2022
BASE
Show details
2
Neuronale maschinelle Übersetzung für ressourcenarme Szenarien ... : Neural machine translation for low-resource scenarios ...
Kim, Yunsu. - : RWTH Aachen University, 2022
BASE
Show details
3
Maschinelle Übersetzung für akademische Texte ...
Delorme Benites, Alice. - : ZHAW Zürcher Hochschule für Angewandte Wissenschaften, 2021
BASE
Show details
4
Möglichkeiten und Grenzen Maschineller Übersetzung
BASE
Show details
5
Automated creation of domain-specific bilingual corpora for machine translation, focusing on dissimilar language pairs
Abstract: Die Wichtigkeit satz-alignierter bilingualer Korpora, auch paralle Korpora genannt, als Trainingsdaten für maschinelle Übersetzungsysteme und für eine Vielzahl anderer Sprachtechnologieanwendungen ist in den letzten Jahren im- mer deutlicher geworden. Sogar noch mehr gefragt sind Korpora, die eine bes- timmte Domäne abdecken und somit noch zielgerichteter für das Training von Deep Learning, statistischen oder beispielbasierten Systemen sind. Das Ziel dieser Doktorarbeit ist es, die Realisierbarkeit der automatisierten Erstel- lung von parallelen Daten aus Wikipedia zu untersuchen. Insbesondere wer- den Sprachpaare untersucht, die in Hinblick auf Oberflächenstruktur und andere Aspekte sehr unterschiedlich sind. Genauer gesagt, wie kann domä- nenspezifischer Text aus Wikipedia effizient gesammelt werden, wie können diese Daten auf Satzebene aligniert werden und wie können diese Satzpaare evaluiert werden, um die bestmöglichen Übersetzungskandidaten zu bekom- men. Die Forschungsfragen sind: Wie viel des Wikipedia-Inhaltes kann verwen- det werden, um bilinguale Korpora für ein bestimmtes Sprachpaar zu bauen und wie können diese Texte effizient aligniert werden; all das mit minimalem menschlichem Input. Für die Beantwortung dieser Frage wurden zwei Sprachen gewählt, die repräsentativ für die Fragestellung sind, nämlich Englisch und Japanisch. Der Ablauf, die Algorithmen, die Softwaremodule und das daraus resultierende Korpus sind als Proof of Concept zu verstehen und können an andere Domä- nen und Sprachpaare angepasst werden. Diese Arbeit schlägt eine Methode für themenspezifisches Datensammeln aus Wikipedia, eine Alignierungsmethode und eine Qualitätsmetrik vor. Die Algorithmen der in dem Zusammenhang entstandenen Software sind sowohl generisch beschrieben, wie auch in Python implementiert. Das Ergebnis einer Iteration der Software, 66,000 Satzpaare, ist der erste experimentelle Daten- satz. Dieser Datensatz wird von Experten evaluiert, um die Ergiebigkeit, Um- setzbarkeit und Effizienz dieser Methode zu untersuchen. ; The significance of sentence-aligned bilingual corpora, so-called parallel corpora, as training sets for machine translation systems and for various other language technology applications has become more and more evident in re- cent years. Even more desirable are collections which address a certain domain and hence offer more precise data for training of deep learning, statistical, or example-based approaches. The goal of this doctoral dissertation is to exam- ine the feasibility of automated bilingual corpus creation from Wikipedia, specifically for languages which differ significantly in surface characteristics and other aspects. More precisely, how can Wikipedia be crawled to obtain domain-specific corpora in an efficient way, how can these corpora be sentence- aligned, and how can these alignments be evaluated to obtain the highest pos- sible probability of a translated or equivalent sentence. The research questions addressed in this work are: How much of the text on Wikipedia content can be used to build a bilingual aligned corpus for a spe- cific language pair, and how can these texts be selected and aligned efficiently, all with minimal human input in the process. The question is addressed by selecting two languages, which are represen- tative of a dissimilar pair, English and Japanese. The resulting procedure, al- gorithms, software modules, and created corpus are a proof of concept, which can be adjusted in order to be applied to other dissimilar language pairs. This dissertation proposes a method for crawling from Wikipedia by topic, aligning this data into a parallel corpus and a novel metric that measures the relative quality of this alignment. The resulting program tool chain is pre- sented as a generic algorithm and is implemented in the Python programming language. The result of a first iteration of the software resulted in an English- Japanese parallel corpus of 66,000 sentence pairs. Human expert evaluations are presented to show the yield, feasibility, and efficiency of this method.
Keyword: 17.98 Textsammlungen; 54.59 Programmierung: Sonstiges; 54.72 Künstliche Intelligenz; 54.89 Angewandte Informatik: Sonstiges; parallel Corpora / machine translation / natural language processing / web-crawling / software-application; Parallele Korpora / maschinelle Übersetzung / Natural Language Processing / Web-craling / Software-Applikation
URL: http://othes.univie.ac.at/65012/
BASE
Hide details
6
Evaluation von Übersetzungen wirtschaftlicher Fachtexte in DeepL
BASE
Show details
7
Gender bias in machine translation
BASE
Show details
8
Qualitätsunterschiede zwischen maschineller und computergestützter Übersetzung
BASE
Show details
9
Problem solving activities in post-editing and translation from scratch : a multi-method study
Nitzke, Jean. - Berlin : Language Science Press, 2019
UB Frankfurt Linguistik
Show details
10
Machine translation and global research : towards improved machine translation literacy in the scholarly community
Buitrago Ciro, Jairo; Bowker, Lynne. - Bingley, UK : Emerald Publishing, 2019
BLLDB
UB Frankfurt Linguistik
Show details
11
Comparative Quality Estimation for Machine Translation. An Application of Artificial Intelligence on Language Technology using Machine Learning of Human Preferences ...
Avramidis, Eleftherios. - : Universität des Saarlandes, 2019
BASE
Show details
12
Comparative Quality Estimation for Machine Translation. An Application of Artificial Intelligence on Language Technology using Machine Learning of Human Preferences
Avramidis, Eleftherios. - : Saarländische Universitäts- und Landesbibliothek, 2019
BASE
Show details
13
Neuronale maschinelle Übersetzung und Post-Editing vs. menschliche Übersetzung
BASE
Show details
14
Multiword units in machine translation and translation technology
Mitkov, Ruslan; Monti, Johanna; Pastor, Gloria Corpas. - Amsterdam [u.a.] : Benjamins, 2018
Leibniz-Zentrum Allgemeine Sprachwissenschaft
Show details
15
Syntaktische und semantische Fehler in den von OnlineÜbersetzungsprogrammen übersetzten Texten - Sprachkombination Deutsch-Türkisch/Türkisch-Deutsch [Online resource]
In: Diyalog : interkulturelle Zeitschrift für Germanistik / Organ des türkischen Germanistenverbandes GERDER 2016 (2016) 2, 40-55
Linguistik-Repository
Show details
16
The Routledge encyclopedia of translation technology
Chan, Sin-wai (Hrsg.). - 1. publ. - London [u.a.] : Routledge, 2015
IDS Mannheim
Show details
17
The Routledge encyclopedia of translation technology
Chan, Sin-wai (Hrsg.). - London [u.a.] : Routledge, 2015
BLLDB
UB Frankfurt Linguistik
Show details
18
Decoding strategies for syntax-based statistical machine translation ... : Dekodierstrategien für syntaxbasierte statistische maschinelle Übersetzung ...
Braune, Fabienne. - : Universität Stuttgart, 2015
BASE
Show details
19
Decoding strategies for syntax-based statistical machine translation ; Dekodierstrategien für syntaxbasierte statistische maschinelle Übersetzung
BASE
Show details
20
The Welsh language in the digital age : = Y gymraeg yn yr oes ddigidol
Evas, Jeremy. - Heidelberg [u.a.] : Springer, 2014
BLLDB
UB Frankfurt Linguistik
Show details

Page: 1 2 3 4 5...19

Catalogues
191
57
0
0
2
12
5
Bibliographies
131
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
73
3
0
0
Open access documents
31
14
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern