1 |
A proposal for an architecture to extract information from sms messages during emergency situations
|
|
|
|
BASE
|
|
Show details
|
|
2 |
Learning non-verbal relations under open information extraction paradigm
|
|
|
|
BASE
|
|
Show details
|
|
3 |
Construção de estruturas ontológicas a partir de textos: um estudo baseado no método formal concept analysis e em papéis semânticos
|
|
|
|
BASE
|
|
Show details
|
|
4 |
Expansão de consultas com realimentação e pseudo realimentação de relevantes em um sistema que utiliza o modelo TR+ para indexar e recuperar documentos
|
|
Borges, Thyago Bohrer. - : Pontifícia Universidade Católica do Rio Grande do Sul, 2009. : Porto Alegre, 2009
|
|
BASE
|
|
Show details
|
|
5 |
Integração de ferramentas para compilação e exploração de corpora
|
|
|
|
Abstract:
Este trabalho realiza um estudo da tipologia e disponibilidade de corpora. São discutidas questões referentes ao projeto de um corpus no que se refere a sua compilação. São apresentadas funcionalidades para exploração de corpora e analisadas ferramentas e recursos disponíveis para trabalhar com corpus. A seleção de ferramentas adequadas para compilação e exploração de corpora de textos em língua natural representa hoje um desafio aos pesquisadores da área. Muitas das ferramentas disponíveis dependem de licenças e plataformas específicas para serem executadas, limitam o uso de vários formatos de documento ou criam padrões próprios de codificação de corpus e de anotações, dificultando a criação, a interoperabilidade e o compartilhamento de recursos lingüísticos entre grupos de pesquisas. Nesse sentido é apresentada e descrita uma ferramenta para a lingüística de corpus que construímos e oferecemos à comunidade de pesquisadores em língua portuguesa – a ferramenta ENTRELINHAS. Esta ferramenta facilita a compilação e agrega funcionalidades essenciais para exploração de corpora. A ferramenta adere a um formato de codificação compatível com o Portal de Córpus do NILC/USP contribuindo com o intercâmbio de recursos para o processamento da língua portuguesa. Uma análise quanto ao uso dessa ferramenta também é apresentada. ; In this work we present a brief study on the taxonomy and availability of text corpora in order to introduce questions concerning corpus design and corpus compiling. We present corpus exploring functionalities and we bring comments on available tools and resources to work with corpora. Selecting the suitable tools for corpora compiling and analysis is still a challenge to researchers in the field. Many of the available tools are commercially distributed, depend on specific platforms, restrict file format usage or create their own standards for corpus codification and annotation, what makes it more difficult to interoperate and to share linguistic resources among research groups. In this context we present and detail ENTRELINHAS, the corpus linguistics tool we built and we make available to Portuguese language researchers in this field. ENTRELINHAS eases corpus compiling and makes basic resources for Portuguese language corpora exploring available. The tool adheres to an encoding standard that keeps it compatible with NILC/USP's Portal de Córpus. A discussion on the report of the use of ENTRELINHAS is also presented.
|
|
Keyword:
INFORMÁTICA; LINGUÍSTICA COMPUTACIONAL; LINGUÍSTICA DE CORPUS; PROCESSAMENTO DE TEXTOS (COMPUTAÇÃO)
|
|
URL: http://hdl.handle.net/10923/1636
|
|
BASE
|
|
Hide details
|
|
8 |
SiSe: medida de similaridade semântica entre ontologias em português
|
|
|
|
BASE
|
|
Show details
|
|
10 |
Termos e relacionamentos em evidência na recuperação de informação
|
|
|
|
BASE
|
|
Show details
|
|
12 |
Distributing linguistic knowledge in a multi-agent natural language processing system : re-modelling the dictionary
|
|
|
|
BASE
|
|
Show details
|
|
13 |
Análise léxico-morfológica em linguagem natural: dicionário em memória primária para otimizar o acesso.
|
|
|
|
BASE
|
|
Show details
|
|
14 |
Análise léxico-morfológica em linguagem natural: dicionário em memória primária para otimizar o acesso.
|
|
|
|
BASE
|
|
Show details
|
|
|
|