1 |
French de and en as expressions of the genitive case: a unified analysis within LFG and computational implementation in XLE
|
|
|
|
In: DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, Vol 37, Iss 1 (2021) (2021)
|
|
BASE
|
|
Show details
|
|
2 |
Uma gramática computacional de um fragmento do nheengatu / A computational grammar for a fragment of Nheengatu
|
|
|
|
In: Revista de Estudos da Linguagem, Vol 29, Iss 3, Pp 1717-1777 (2021) (2021)
|
|
BASE
|
|
Show details
|
|
3 |
The possessive passive in portuguese: a lexicalist approach with a computational implementation
|
|
|
|
In: Fórum Linguístico, Vol 15, Iss 4, Pp 3333-3356 (2018) (2018)
|
|
BASE
|
|
Show details
|
|
4 |
Modelação computacional de padrões variáveis de concordância em português
|
|
|
|
In: Revista de Estudos da Linguagem, Vol 21, Iss 1 (2014) (2014)
|
|
BASE
|
|
Show details
|
|
5 |
Utilização de informações lexicais extraídas automaticamente de corpora na análise sintática computacional do português
|
|
|
|
In: Revista de Estudos da Linguagem, Vol 19, Iss 1 (2012) (2012)
|
|
Abstract:
No desenvolvimento de analisadores sintáticos profundos paratextos irrestritos, a principal dificuldade a ser vencida é a modelaçãodo léxico. Tradicionalmente, duas estratégias têm sido usadas paralidar com a informação lexical na análise sintática automática: acompilação de milhares de entradas lexicais ou a formulação decentenas de regras morfológicas. Devido aos processos produtivosde formação de palavras, aos nomes próprios ou a grafias não padrão,a primeira estratégia, que subjaz aos analisadores do português doBrasil (PB) livremente descarregáveis da Internet, não é robusta.A última estratégia, por sua vez, constitui tarefa não trivial deengenharia do conhecimento, consumindo muito tempo. Nomomento, o PB não dispõe de um analisador sintático de amplacobertura licenciado como software livre. Visando aopreenchimento o mais rápido possível dessa lacuna, argumentamosneste artigo que uma solução bem menos custosa e muito maiseficiente para o gargalo lexical consiste em simplesmentereaproveitar, como componente lexical do processamento sintáticoprofundo, etiquetadores morfossintáticos livremente disponíveis. Além disso, graças à ampla e gratuita disponibilidade de corporamorfossintaticamente anotados do PB e eficientes pacotes deaprendizado de máquina, a construção de etiquetadores de altaacurácia adicionais tornou-se uma tarefa que quase não demandaesforço. A fim de integrar facilmente o output de etiquetadores dediferentes arquiteturas em parsers tabulares de gramáticas livresde contexto compilados por meio do Natural Language Toolkit(NLTK), desenvolvemos um módulo em Python denominadoALEXP. Pelo que sabemos, o ALEXP é o primeiro software livreespecialmente otimizado para o processamento do português arealizar essa tarefa. A funcionalidade da ferramenta é descrita pormeio de protótipos de gramática do PB aplicados na análise desentenças do mundo real, com resultados bastante promissores.
|
|
Keyword:
Análise sintática automática; Aprendizado de máquina; Etiquetador morfossintático; Etiquetagem morfossintática; Gramática livre de contexto; Language and Literature; Linguística computacional; P; P1-1091; Philology. Linguistics; Processamento automático da linguagem natural; Processamento computacional do português
|
|
URL: https://doaj.org/article/ff27045aa7114c2bb0b98f55a218a876
|
|
BASE
|
|
Hide details
|
|
|
|