1 |
Sprachliche Steuerung in der Technischen Dokumentation mit Controlled-Language-Checkern und Authoring-Memory-Systemen : Untersuchungen zur Verbesserung der Effizienz von Schreib- und Übersetzungsprozessen
|
|
|
|
BLLDB
|
|
UB Frankfurt Linguistik
|
|
Show details
|
|
3 |
Reordering Space Design in Statistical Machine Translation
|
|
|
|
In: ISSN: 1574-020X ; EISSN: 1574-0218 ; Language Resources and Evaluation ; https://hal.archives-ouvertes.fr/hal-01620902 ; Language Resources and Evaluation, Springer Verlag, 2016, 50, pp.375-410. ⟨10.1007/s10579-016-9353-8⟩ (2016)
|
|
BASE
|
|
Show details
|
|
4 |
Language Model Data Augmentation for Keyword Spotting
|
|
|
|
In: Annual Conference of the International Speech Communication Association ; https://hal.archives-ouvertes.fr/hal-01837186 ; Annual Conference of the International Speech Communication Association , Jan 2016, San Francisco, United States (2016)
|
|
BASE
|
|
Show details
|
|
5 |
LIMSI@WMT16: Machine Translation of News
|
|
|
|
In: First Conference on Machine Translation ; https://hal.archives-ouvertes.fr/hal-01388659 ; First Conference on Machine Translation, Aug 2016, Berlin, Germany. pp.239--245, ⟨10.18653/v1/W16-2304⟩ ; https://statmt.org/wmt16 (2016)
|
|
BASE
|
|
Show details
|
|
6 |
A new language model based on possibility theory
|
|
|
|
In: Springer LNCS series, Lecture Notes in Computer Science. ; https://hal.inria.fr/hal-01336535 ; Springer LNCS series, Lecture Notes in Computer Science., 2016 (2016)
|
|
BASE
|
|
Show details
|
|
7 |
СИНТАКСИЧЕСКАЯ МНОГОЗНАЧНОСТЬ И НЕОДНОЗНАЧНОСТЬ В ПЕРСПЕКТИВЕ МАШИННОГО ПЕРЕВОДА
|
|
КОЗЕРЕНКО ЕЛЕНА БОРИСОВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский педагогический государственный университет», 2016
|
|
BASE
|
|
Show details
|
|
8 |
ПРОЕКТ СОЗДАНИЯ КИТАЙСКО-РУССКОГО ПАРАЛЛЕЛЬНОГО КОРПУСА ОФИЦИАЛЬНО-ДЕЛОВЫХ ТЕКСТОВ С ДИСКУРСИВНО-СТРУКТУРНОЙ РАЗМЕТКОЙ
|
|
МУХИН МИХАИЛ ЮРЬЕВИЧ; ЯН И. - : Государственное образовательное учреждение высшего профессионального образования «Южно-Уральский государственный университет», 2016
|
|
Abstract:
Статья посвящена проекту создания китайско-русского параллельного корпуса официально-деловых текстов с дискурсивно-структурной разметкой. Данная разметка заключается в описании структуры каждого абзаца в виде сети дискурсивных единиц, соединенных дискурсивными отношениями. Основу первичного наполнения корпуса составляют доклады о работе правительства КНР на китайском языке и их официальные переводы на русский. Выравнивание китайских и русских текстов в корпусе, т. е. их синтаксическое соотнесение, проводится по структуре каждого абзаца. В статье представлены история разработки проблемы создания синтаксических корпусов, общие задачи проекта, его теоретические основания и прикладные перспективы, критерии отбора текстов для корпуса, принципы разметки и выравнивания текстов, а также программное обеспечение для разметки и хранения данных (общая схема данных и интерфейс). Создаваемый корпус может быть в дальнейшем использован для решения задач машинного перевода и других алгоритмов автоматической обработки текста, обучения иностранным языкам, сопоставительной лингвистики, теории перевода и т. д. ; This paper is devoted to building a Chinese-Russian Parallel Discourse Structure Corpus of Official Texts (CRPDT) that aims at producing a discourse treebank, in which Chinese and Russian parallel texts are manually annotated and aligned at the level of discourse structure. In this corpus, discourse units and their discourse relations are annotated for each paragraph in the parallel texts. Experimental research is based on the material of 4 Chinese source texts “Reports on the work of the Government” and their Russian translations. The paper presents the history and development of building discourse treebanks, the principles of annotation for building parallel discourse treebanks. This paper shows how to work on the discourse segmentation for Chinese-Russian parallel texts. Annotation and alignment tools take from Chinese-English Parallel Discourse Treebank. We postulate that the corpus might be useful for machine translation, language learning, translation studies, discourse analysis of Chinese and Russian texts and future Natural Language Processing.
|
|
Keyword:
CORPUS LINGUISTICS,PARALLEL CORPUS,DISCOURSE STRUCTURE ANNOTATION,TREEBANK,CHINESE-RUSSIAN CORPUS,DISCOURSE-LEVEL ALIGNMENT,NATURAL LANGUAGE PROCESSING,MACHINE TRANSLATION,КОРПУСНАЯ ЛИНГВИСТИКА,ПАРАЛЛЕЛЬНЫЙ КОРПУС,ДИСКУРСИВНО-СТРУКТУРНАЯ РАЗМЕТКА,ТРИБАНК,КИТАЙСКО-РУССКИЙ КОРПУС,ДИСКУРСИВНОЕ ВЫРАВНИВАНИЕ,АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТА,МАШИННЫЙ ПЕРЕВОД
|
|
URL: http://cyberleninka.ru/article_covers/16929189.png http://cyberleninka.ru/article/n/proekt-sozdaniya-kitaysko-russkogo-parallelnogo-korpusa-ofitsialno-delovyh-tekstov-s-diskursivno-strukturnoy-razmetkoy
|
|
BASE
|
|
Hide details
|
|
9 |
ПРОБЛЕМА ВЫБОРА ЭКВИВАЛЕНТНЫХ ТЕРМИНОВ И ОПРЕДЕЛЕНИЯ ОБЛАСТИ ТЕРМИНОЛОГИИ ПРИ ПЕРЕВОДЕ АНГЛОЯЗЫЧНЫХ ХУДОЖЕСТВЕННЫХ ПРОИЗВЕДЕНИЙ НА РУССКИЙ ЯЗЫК
|
|
СИСЕЙКИНА ИРИНА АЛЕКСАНДРОВНА. - : Государственное образовательное учреждение высшего профессионального образования «Пензенский государственный университет», 2016
|
|
BASE
|
|
Show details
|
|
10 |
Measuring acceptability of machine translated enterprise content
|
|
Castilho, Sheila. - : Dublin City University. Faculty of Humanities and Social Science, 2016. : Dublin City University. School of Applied Language and Intercultural Studies, 2016. : Dublin City University. ADAPT, 2016
|
|
In: Castilho, Sheila orcid:0000-0002-8416-6555 (2016) Measuring acceptability of machine translated enterprise content. PhD thesis, Dublin City University. (2016)
|
|
BASE
|
|
Show details
|
|
11 |
Combining translation memories and syntax-based SMT: experiments with real industrial data
|
|
|
|
In: Li, Liangyou orcid:0000-0002-0279-003X , Parra Escartín, Carla orcid:0000-0002-8412-1525 and Liu, Qun orcid:0000-0002-7000-1792 (2016) Combining translation memories and syntax-based SMT: experiments with real industrial data. Baltic Journal of Modern Computing, 4 (2). pp. 165-177. ISSN 2255-8942 (2016)
|
|
BASE
|
|
Show details
|
|
12 |
Dependency graph-based statistical machine translation
|
|
Li, Liangyou. - : Dublin City University. School of Computing, 2016
|
|
In: Li, Liangyou orcid:0000-0002-0279-003X (2016) Dependency graph-based statistical machine translation. PhD thesis, Dublin City University. (2016)
|
|
BASE
|
|
Show details
|
|
13 |
Automatic construction of discourse corpora for dialogue translation
|
|
|
|
In: Wang, Longyue orcid:0000-0002-9062-6183 , Zhang, Xiaojun, Tu, Zhaopeng, Way, Andy orcid:0000-0001-5736-5930 and Liu, Qun orcid:0000-0002-7000-1792 (2016) Automatic construction of discourse corpora for dialogue translation. In: 10th Language Resources and Evaluation Conference, 23-28 May 2016, Portorož, Slovenia. ISBN 978-2-9517408-9-1 (2016)
|
|
BASE
|
|
Show details
|
|
14 |
On the lookout for accessible translation aids: current scenario and new horizons for blind translation students and professionals
|
|
|
|
In: Rodríguez Vázquez, Silvia orcid:0000-0002-9945-5544 (2016) On the lookout for accessible translation aids: current scenario and new horizons for blind translation students and professionals. Journal of Translator Education and Translation Studies, 1 (2). pp. 115-135. (2016)
|
|
BASE
|
|
Show details
|
|
15 |
Human factors in machine translation and post-editing among institutional translators
|
|
|
|
In: Cadwell, Patrick orcid:0000-0002-2371-4378 , Castilho, Sheila orcid:0000-0002-8416-6555 , O'Brien, Sharon orcid:0000-0003-4864-5986 and Mitchell, Linda orcid:0000-0002-1883-9037 (2016) Human factors in machine translation and post-editing among institutional translators. Translation Spaces, 5 (2). pp. 222-243. ISSN 2211-3711 (2016)
|
|
BASE
|
|
Show details
|
|
16 |
Using SMT for OCR error correction of historical texts
|
|
|
|
In: Afli, Haithem orcid:0000-0002-7449-4707 , Qui, Zhengwei, Way, Andy orcid:0000-0001-5736-5930 and Sheridan, Páraic (2016) Using SMT for OCR error correction of historical texts. In: Tenth International Conference on Language Resources and Evaluation (LREC 2016), 23-28 May 2016, Portorož, Slovenia. ISBN 978-2-9517408-9-1 (2016)
|
|
BASE
|
|
Show details
|
|
17 |
ProphetMT: a tree-based SMT-driven controlled language authoring/post-editing tools
|
|
|
|
In: Wu, Xiaofeng, Du, Jinhua orcid:0000-0002-3267-4881 and Way, Andy orcid:0000-0001-5736-5930 (2016) ProphetMT: a tree-based SMT-driven controlled language authoring/post-editing tools. In: Tenth International Conference on Language Resources and Evaluation (LREC 2016), 23-28 May 2016, Portorož, Slovenia. ISBN 978-2-9517408-9-1 (2016)
|
|
BASE
|
|
Show details
|
|
18 |
Enhancing access to online education: quality machine translation of MOOC content
|
|
|
|
In: Kordoni, Valia, van den Bosch, Antal orcid:0000-0003-2493-656X , Kermanidis, Katia Lida orcid:0000-0002-3270-5078 , Sosoni, Vilelmini orcid:0000-0002-9583-4651 , Cholakov, Kostadin, Hendrickx, Iris, Huck, Matthias and Way, Andy orcid:0000-0001-5736-5930 (2016) Enhancing access to online education: quality machine translation of MOOC content. In: Tenth International Conference on Language Resources and Evaluation (LREC 2016), 23-28 May 2016, Portorož, Slovenia. ISBN 978-2-9517408-9-1 (2016)
|
|
BASE
|
|
Show details
|
|
19 |
Improving subject-verb agreement in SMT
|
|
|
|
In: Vanmassenhove, Eva orcid:0000-0003-1162-820X , Du, Jinhua orcid:0000-0002-3267-4881 and Way, Andy orcid:0000-0001-5736-5930 (2016) Improving subject-verb agreement in SMT. In: Fifth Workshop on Hybrid Approaches to Translation (HyTra), 1 June 2016, Riga, Latvia. (2016)
|
|
BASE
|
|
Show details
|
|
20 |
From Arabic user-generated content to machine translation: integrating automatic error correction
|
|
|
|
In: Afli, Haithem orcid:0000-0002-7449-4707 , Aransa, Walid, Lohar, Pintu and Way, Andy orcid:0000-0001-5736-5930 (2016) From Arabic user-generated content to machine translation: integrating automatic error correction. In: 17th International Conference on Intelligent Text Processing and Computational Linguistics, 3–9 Apr 2016, Konya, Turkey. (2016)
|
|
BASE
|
|
Show details
|
|
|
|