DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 21

1
An Ensemble Approach to Acronym Extraction using Transformers ...
BASE
Show details
2
Challenges in Translation of Emotions in Multilingual User-Generated Content: Twitter as a Case Study ...
BASE
Show details
3
Annotated corpora and tools of the PARSEME Shared Task on Semi-Supervised Identification of Verbal Multiword Expressions (edition 1.2)
BASE
Show details
4
A Lexical Simplification Tool for Promoting Health Literacy
BASE
Show details
5
Annotated corpora and tools of the PARSEME Shared Task on Automatic Identification of Verbal Multiword Expressions (edition 1.1)
BASE
Show details
6
LexSubNC: a Dataset of Lexical Substitution for Nominal Compounds
In: Proceedings of the 12th International Conference on Computational Semantics (IWCS 2017) - Short papers ; https://hal.archives-ouvertes.fr/hal-01795956 ; Proceedings of the 12th International Conference on Computational Semantics (IWCS 2017) - Short papers, 2017, Montpellier, France (2017)
BASE
Show details
7
Annotated corpora and tools of the PARSEME Shared Task on Automatic Identification of Verbal Multiword Expressions (edition 1.0)
BASE
Show details
8
How Naked is the Naked Truth? A Multilingual Lexicon of Nominal Compound Compositionality
In: Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers) ; https://hal.archives-ouvertes.fr/hal-01459911 ; Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 2016, Berlin, Germany. pp.156--161, ⟨10.18653/v1/P16-2026⟩ (2016)
BASE
Show details
9
Verblexpor : um recurso léxico com anotação de papéis semânticos para o português
Zilio, Leonardo. - 2015
Abstract: Esta tese propõe um recurso léxico de verbos com anotação de papéis semânticos, denominado VerbLexPor, baseado em recursos como VerbNet, PropBank e FrameNet. As bases teóricas da proposta são interdisciplinares e retiradas da Linguística de Corpus e do Processamento de Linguagem Natural (PLN), visando-se a contribuir para a Linguística e para a Computação. As hipóteses de pesquisa são: a) um mesmo conjunto de papéis semânticos pode ser aplicado a diferentes gêneros textuais; e b) as diferenças entre esses gêneros se destacam no ranqueamento dos papéis semânticos. O desenvolvimento do VerbLexPor se apoia em dois corpora: um especializado, com mais de 1,6 milhão de palavras, composto por artigos científicos de Cardiologia de três periódicos brasileiros; e um não especializado, com mais de 1 milhão de palavras composto por artigos do jornal popular Diário Gaúcho. Os corpora foram anotados com o parser PALAVRAS, e as informações de sentenças, verbos e argumentos foram extraídas e armazenadas em um banco de dados. O VerbLexPor tem 192 verbos e mais de 15 mil argumentos anotados distribuídos em mais de 6 mil sentenças. Observou-se que o corpus do Diário Gaúcho privilegia uma sintaxe direta e pouco uso de voz passiva e adjuntos, enquanto o corpus de Cardiologia apresenta mais voz passiva e um maior uso de INSTRUMENTOS na posição de sujeito, além de uma menor incidência de AGENTES. Foram realizados também alguns experimentos paralelos, como a anotação de papéis semânticos por vários anotadores e o agrupamento automático de verbos. Na tarefa de múltiplos anotadores, cada um anotou exatamente as mesmas 25 orações. Os anotadores receberam um manual de anotação e um treinamento básico (explicação sobre a tarefa e dois exemplos de anotação). Usou-se o cálculo de multi-π para avaliar a concordância entre os anotadores, e o resultado foi de π = 0,25. Os motivos para essa concordância baixa podem estar na falta de um treinamento mais completo. A tarefa de agrupamento de verbos mostrou que a sintaxe e a semântica são igualmente importantes para o agrupamento. Este estudo contribui para a área de Linguística, com um léxico de verbos anotados semanticamente, e também para a Computação, com dados que podem ser consultados e processados para diversas aplicações do PLN, principalmente por estarem disponíveis nos formatos XML e SQL. ; This dissertation aims at developing a lexical resource of verbs annotated with semantic roles, called VerbLexPor, and based on other resources, such as VerbNet, PropBank, and FrameNet. The theoretical bases of this study lies in Corpus Linguistics and Natural Language Processing (NLP), so that it aims at contributing to both Linguistics and Computer Science. The hypotheses are: a) one set of semantic roles can be applied to different genres; and b) the differences among genres are shown by the ranking of semantic roles. The development of VerbLexPor has two corpora at the basis: a specialized one, with more than 1.6 million words, composed by scientific papers in the field of Cardiology from three Brazilian journals; and a non-specialized one, with more than 1 million words, composed by newspaper articles from Diário Gaúcho. The corpora were analyzed with the parser PALAVRAS, and sentence, verb and argument information was extracted and stored in a database. VerbLexPor has 192 verbs and more than 15 thousand arguments annotated with semantic roles, distributed among more than 6 thousand sentences. We observed that Diário Gaúcho has a more direct syntax, with less passive voice and adjuncts, while Cardiology has more passive voice and more INSTRUMENTS for subjects, and fewer AGENTS. We also conducted some parallel experiments, such as semantic role labeling with multiple annotators and automatic verbal clustering. In the multiple annotators task, each of them annotated exactly the same 25 sentences. They received an annotation manual and basic training (explanation on the task and two annotation examples). We used multi-π to evaluate agreement among annotators, and results were π = 0,25. Reasons for this low agreement may be a lack of a thoroughly developed training. The verbal clustering task showed that syntax and semantics are equally important for verbal clustering. This study contributes to Linguistics, with a verbal lexicon annotated with semantic roles, and also to Computer Science, with data that can be assessed and processed for various NLP applications, especially because the data are available in both XML and SQL formats.
Keyword: Corpus; Corpus linguistics; Lexical resource; Língua portuguesa; Linguagem especializada; Linguística computacional; NLP; Semantic role labeling
URL: http://hdl.handle.net/10183/131590
BASE
Hide details
10
Desenvolvimento de um recurso léxico com papéis semânticos para o português ; Developing a lexical resource annotated with semantic roles for Portuguese
BASE
Show details
11
CATÁLOGO ALEMÃO-PORTUGUÊS DE CONSTRUÇÕES RECORRENTES EM CARDIOLOGIA
BASE
Show details
12
Colocações especializadas e 'Komposita' : um estudo constrastivo alemão-português na área de cardiologia
Zilio, Leonardo. - 2009
BASE
Show details
13
Colocações especializadas e 'Komposita' : um estudo constrastivo alemão-português na área de cardiologia
Zilio, Leonardo. - 2009
BASE
Show details
14
Estudo exploratório sobre artigos de cardiologia em alemão e português: macroestruturas e usos dos termos herzinsuffizienz - insuficiência cardíaca
BASE
Show details
15
Estudo exploratório sobre artigos de cardiologia em alemão e português: macroestruturas e usos dos termos herzinsuffizienz - insuficiência cardíaca
BASE
Show details
16
Reconhecimento terminológico de fraseologias associadas a compostos nominais da língua alemã em textos de meio ambiente
Zilio, Leonardo. - 2006
BASE
Show details
17
Reconhecimento terminológico de fraseologias associadas a compostos nominais da língua alemã em textos de meio ambiente
Zilio, Leonardo. - 2006
BASE
Show details
18
Resíduos e abfälle: a busca e o tratamento da equivalência terminológica
Zilio, Leonardo. - 2005
BASE
Show details
19
Resíduos e abfälle: a busca e o tratamento da equivalência terminológica
Zilio, Leonardo. - 2005
BASE
Show details
20
Estudo de termos compostos na língua alemã : perfis de komposita no protocolo de Quioto e suas correspondências em um glossário multilíngue de gestão ambiental
BASE
Show details

Page: 1 2

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
21
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern