DE eng

Search in the Catalogues and Directories

Hits 1 – 8 of 8

1
Construção e avaliação de modelos semânticos distribucionais ; Construction and evaluation of semantic distributional models
BASE
Show details
2
Extração multilíngue de termos multipalavra em corpora comparáveis
Abstract: Este trabalho investiga técnicas de extração de termos multipalavra a partir de corpora comparáveis, que são conjuntos de textos em duas (ou mais) línguas sobre o mesmo domínio. A extração de termos, especialmente termos multipalavra é muito importante para auxiliar a criação de terminologias, ontologias e o aperfeiçoamento de tradutores automáticos. Neste trabalho utilizamos um corpus comparável português/inglês e queremos encontrar termos e seus equivalentes em ambas as línguas. Para isso começamos com a extração dos termos separadamente em cada língua, utilizando padrões morfossintáticos para identificar os n-gramas (sequências de n palavras) mais prováveis de serem termos importantes para o domínio. A partir dos termos de cada língua, utilizamos o contexto, isto é, as palavras que ocorrem no entorno dos termos para comparar os termos das diferentes línguas e encontrar os equivalentes bilíngues. Tínhamos como objetivos principais neste trabalho fazer a identificação monolíngue de termos, aplicar as técnicas de alinhamento para o português e avaliar os diferentes parâmetros de tamanho e tipo (PoS utilizados) de janela para a extração de contexto. Esse é o primeiro trabalho a aplicar essa metodologia para o Português e apesar da falta de alguns recursos léxicos e computacionais (como dicionários bilíngues e parsers) para essa língua, conseguimos alcançar resultados comparáveis com o estado da arte para trabalhos em Francês/Inglês. ; This work investigates techniques for multiword term extraction from comparable corpora, which are sets of texts in two (or more) languages about the same topic. Term extraction, specially multiword terms is very important to help the creation of terminologies, ontologies and the improvement of machine translation. In this work we use a comparable corpora Portuguese/ English and want to find terms and their equivalents in both languages. To do this we start with separate term extraction for each language. Using morphossintatic patterns to identify n-grams (sequences of n words) most likely to be important terms of the domain. From the terms of each language, we use their context, i. e., the words that occurr around the term to compare the terms of different languages and to find the bilingual equivalents. We had as main goals in this work identificate monolingual terms, apply alignment techniques for Portuguese and evaluate the different parameters of size and type (used PoS) of window to the context extraction. This is the first work to apply this methodology to Portuguese and in spite of the lack of lexical and computational resources (like bilingual dictionaries and parsers) for this language, we achieved results comparable to state of the art in French/English.
Keyword: Comparable corpora alignment; Corpus; Língua portuguesa; Multilingual alignment; Natural language processing; Processamento : Linguagem natural; Term extraction
URL: http://hdl.handle.net/10183/118257
BASE
Hide details
3
Extração multilíngue de termos multipalavra em corpora comparáveis
BASE
Show details
4
Verblexpor : um recurso léxico com anotação de papéis semânticos para o português
Zilio, Leonardo. - 2015
BASE
Show details
5
Padrões da preposição “de” entre sintagmas nominais em linguagem cotidiana e linguagens técnico-científicas
BASE
Show details
6
Padrões da preposição “de” entre sintagmas nominais em linguagem cotidiana e linguagens técnico-científicas
BASE
Show details
7
Avaliando um rotulador estatístico de categorias morfo-sintáticas para a língua portuguesa ; Evaluating a stochastic part-of-speech tagger for the portuguese language
BASE
Show details
8
Avaliando um rotulador estatístico de categorias morfo-sintáticas para a língua portuguesa ; Evaluating a stochastic part-of-speech tagger for the portuguese language
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
8
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern