1 |
Иероглифы для диалектов: от средневекового байхуа до интернета ... : Characters for dialects: from vernacular Baihua to the Internet ...
|
|
|
|
BASE
|
|
Show details
|
|
2 |
О классификационных критериях в китайской диалектологии ... : On the Classification Criteria in Chinese Dialectology ...
|
|
|
|
BASE
|
|
Show details
|
|
3 |
Китайский язык: термины в XXI веке ... : Chinese language: terminology in the 21st century ...
|
|
|
|
BASE
|
|
Show details
|
|
4 |
Языковая политика и языковые ресурсы в китайском интернете ... : Language policy and language resources on the Chinese Internet ...
|
|
|
|
Abstract:
Языковая политика, которой китайское государство уделяет значительное внимание на протяжении последних десятилетий, освещается на многочисленных официальных сайтах центрального и регионального уровня. Среди задач, поставленных перед лингвистами, – ежегодный статистический анализ слов и иероглифов, которые употребляются в современном китайском языке, прежде всего, в интернете. Технологии, позволяющие автоматически выделять в иероглифических цепочках слова и определять их принадлежность к той или иной части речи в изолирующем китайском языке, лежат также в основе текстовых корпусов, многие из которых доступны в сети. Исследования, связанные с распознаванием и синтезом устной речи, востребованы при разработках в области машинного устного перевода, в процессе изучения путунхуа на специальных сайтах и при создании устных языковых корпусов, в том числе онлайновых диалектных на Тайване и в Гонконге. ... : The language policy and planning in the PRC are represented on various official central and local websites. The annual statistical analysis of Chinese words and characters used online are among the tasks, set by the authorities before the linguists. The technologies, allowing to recognize words within the character texts and to mark them as belonging to a particular part of speech in the isolating syllabic Chinese language are applied within the process of creating numerous text corpora, often accessible on the Web. Speech recognition and speech synthesis technologies based on AI are used in machine translation, on the official websites for Standard Mandarin learners, as well as in spoken corpora. Among the latter are dialect corpora created in Taiwan and Hong Kong and available online. ...
|
|
Keyword:
artificial intelligence; Cantonese; character of the year; Chinese characters; Chinese dialects; Internet; language corpora; language planning; language policy; language resources; lexical frequency studies; machine translation; Minnan dialects; part-of-speech tagging; speech recognition; speech synthesis; Standard Mandarin; word of the year; байхуа; вэньянь; диалекты Миньнань; иероглиф года; иероглифическая письменность; интернет; искусственный интеллект; кантонский диалект; китайские диалекты; китайский язык; лексика; машинный перевод; путунхуа; распознавание речи; синтез речи; слово года; статистические исследования; языковая политика; языковой корпус; языковые ресурсы.
|
|
URL: http://cyberdoi.ru/doi/10.24411/2686-7702-2020-10002 https://dx.doi.org/10.24411/2686-7702-2020-10002
|
|
BASE
|
|
Hide details
|
|
|
|