1 |
Searching for multicomponent terms in comparable scientific corpora ... : Поиск многокомпонентных терминов в сопоставимых корпусах научных текстов ...
|
|
|
|
Abstract:
The paper suggests the use of full-text parallel/comparable corpora with a “built-in” part of machine translation (MT) results for term extraction, harmonization and translation, since analysis and comparison of these texts will assure the possibility to identify terminological units for dictionary entries. We focus on the complicated and non-parallel structure of English multicomponent terminological noun phrases (NPs), their variants and modifications within the same text, which determine the need for a three-part text corpus, including parallel/comparable texts and their MT translation. The research has proved that multicomponent terminological NPs are not only specific for a scientific text, but they demonstrate ambiguous dependency relations, caused by their syntactic compression, which normally is the result of a sentence or of another NP convolution. These modifications are results of a number of standard procedures described in the paper. ... : В статье предлагается использование полнотекстовых сопоставимых корпусов научных текстов со встроенной частью в виде выровненных результатов машинного перевода (МП). Такой корпус предназначен для решения задач извлечения, гармонизации и перевода терминологии, поскольку анализ и сравнение этих текстов позволяет идентифицировать терминологические единицы для формирования словарных статей. Особое внимание уделяется сложным и непараллельным структурам английских многокомпонентных терминологических именных групп, их вариантов и модификаций в рамках одного текста, что определяет необходимость трехчастного корпуса текстов, включающего параллельные/сопоставимые тексты и их машинный перевод. Исследование подтвердило, что многокомпонентные терминологические именные группы не только характерны для научных текстов, но демонстрируют многозначные отношения зависимостей, вызванные их синтаксической компрессией, что как правило является результатом свертки предложения или именной группы. Эти модификации в свою очередь ...
|
|
Keyword:
comparable corpora; lexicography; MT; multicomponent NPs; noun phrase transformation; terminological NPs; лексикография; МП; сопоставимые корпуса текстов; терминологические именные группы; трансформации именных групп
|
|
URL: https://dx.doi.org/10.18721/jhss.12209 https://human.spbstu.ru/en/article/2021.44.09/
|
|
BASE
|
|
Hide details
|
|
|
|