82 |
Aquisição de subcategorization frames para verbos da língua portuguesa ; Subcategorization frames acquisition for portuguese language verbs
|
|
|
|
BASE
|
|
Show details
|
|
83 |
Alinhamento léxico utilizando técnicas híbridas discriminativas e de pós-processamento ; Text alignment
|
|
|
|
BASE
|
|
Show details
|
|
84 |
Alinhamento léxico utilizando técnicas híbridas discriminativas e de pós-processamento ; Text alignment
|
|
|
|
Abstract:
O alinhamento léxico automático é uma tarefa essencial para as técnicas de tradução de máquina empíricas modernas. A abordagem gerativa não-supervisionado têm sido substituída recentemente por uma abordagem discriminativa supervisionada que facilite inclusão de conhecimento linguístico de uma diversidade de fontes. Dentro deste contexto, este trabalho descreve uma série alinhadores léxicos discriminativos que incorporam heurísticas de pós-processamento com o objetivo de melhorar o desempenho dos mesmos para expressões multi-palavra, que constituem um dos desafios da área de processamento de linguagens naturais atualmente. A avaliação é realizada utilizando um gold-standard obtido a partir da anotação de um corpus paralelo de legendas de filmes. Os alinhadores propostos apresentam um desempenho superior tanto ao obtido por uma baseline quanto ao obtido por um alinhador gerativo do estado-da-arte (Giza++), tanto no caso geral quanto para as expressões foco do trabalho. ; Lexical alignment is an essential task for modern empirical machine translation techniques. The unsupervised generative approach is being replaced by a supervised, discriminative one that considerably facilitates the inclusion of linguistic knowledge from several sources. Given this context, the present work describes a series of discriminative lexical aligners that incorporate post-processing heuristics with the goal of improving the quality of the alignments of multiword expressions, which is one of the major challanges in natural language processing today. The evaluation is conducted using a gold-standard obtained from a movie subtitle parallel corpus. The aligners proposed show an alignment quality that is superior both to our baseline and to a state-of-the-art generative aligner (Giza++), for the general case as well as for the expressions that are the focus of this work.
|
|
Keyword:
Lexical alignment; Linguística computacional; Machine learning; Multiword expressions; Natural language processing; Parallel corpora; Processamento : Linguagem natural; UFRGS
|
|
URL: http://hdl.handle.net/10183/27658
|
|
BASE
|
|
Hide details
|
|
85 |
Identificação de expressões multipalavra em domínios específicos
|
|
|
|
BASE
|
|
Show details
|
|
86 |
Aquisição de subcategorization frames para verbos da língua portuguesa ; Subcategorization frames acquisition for portuguese language verbs
|
|
|
|
BASE
|
|
Show details
|
|
87 |
Proceedings of the EACL 2009 Workshop on Cognitive Aspects of Computational Language Acquisition
|
|
|
|
In: https://hal.archives-ouvertes.fr/hal-00437371 ; Association for Computational Linguistics, pp.60, 2009 (2009)
|
|
BASE
|
|
Show details
|
|
88 |
Extração de expressões multipalavra em corpora técnicos ; Extraction of multiword expressions in technical domains
|
|
|
|
BASE
|
|
Show details
|
|
89 |
Extração de expressões multipalavra em corpora técnicos ; Extraction of multiword expressions in technical domains
|
|
|
|
BASE
|
|
Show details
|
|
91 |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras ; Improving the multiword expression treatment in a rule-based machine translator
|
|
|
|
BASE
|
|
Show details
|
|
93 |
Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras ; Improving the multiword expression treatment in a rule-based machine translator
|
|
|
|
BASE
|
|
Show details
|
|
94 |
Picking them up and Figuring them out: Verb-Particle Constructions, Noise and Idiomaticity
|
|
|
|
In: Proceedings of the Twelfth Conference on Natural Language Learning (CoNLL 2008) ; https://hal.archives-ouvertes.fr/hal-01200612 ; Proceedings of the Twelfth Conference on Natural Language Learning (CoNLL 2008), 2008, Manchester, UK, Unknown Region. pp.49--56 (2008)
|
|
BASE
|
|
Show details
|
|
95 |
A verb learning model driven by syntactic constructions ; Um modelo de aquisição de verbos guiado por construções sintáticas
|
|
|
|
BASE
|
|
Show details
|
|
96 |
A verb learning model driven by syntactic constructions ; Um modelo de aquisição de verbos guiado por construções sintáticas
|
|
|
|
BASE
|
|
Show details
|
|
97 |
Validation and Evaluation of Automatically Acquired Multiword Expressions for Grammar Engineering
|
|
|
|
In: Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL) ; https://hal.archives-ouvertes.fr/hal-01200614 ; Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-CoNLL), 2007, Prague, Czech Republic. pp.1034--1043 (2007)
|
|
BASE
|
|
Show details
|
|
|
|