Home
Catalogue search
Refine your search:
Keyword
Creator / Publisher:
Sorato, Danielly (3)
Fileto, Renato (1)
Goularte, Fábio Bif (1)
Universidade Federal de Santa Catarina (1)
Year
Medium
Type:
Article (2)
Miscellaneous (1)
BLLDB-Access
Search in the Catalogues and Directories
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
AND
OR
AND NOT
All fields
Title
Creator / Publisher
Keyword
Year
Sort by
creator [A → Z]
'
creator [Z → A]
'
publishing year ↑ (asc)
'
publishing year ↓ (desc)
'
title [A → Z]
'
title [Z → A]
'
Simple Search
Hits 1 – 3 of 3
1
SSHOC Webinar: The Multilingual Corpus of Survey Questionnaires ...
Sorato, Danielly
. - : Zenodo, 2021
BASE
Show details
2
SSHOC Webinar: The Multilingual Corpus of Survey Questionnaires ...
Sorato, Danielly
. - : Zenodo, 2021
BASE
Show details
3
Seleção e Avaliação Experimental de Ferramentas para Anotação Morfossintática Automática
Sorato, Danielly
. - : Florianópolis, SC., 2016
Abstract:
TCC(graduação) - Universidade Federal de Santa Catarina. Centro Tecnológico. Ciências da Computação. ; Documentos disponíveis na Web (e.g., conteúdos de bibliotecas digitais) e postagens em mídias sociais (e.g., Twitter, Facebook) são fontes abundantes de informações. Nesses textos pode-se encontrar componentes semanticamente ricos denominados palavras relevantes. Essas palavras podem ser, por exemplo, entidades nomeadas (i.e., menções a locais, pessoas, instituições, etc.) ou componentes e expressões que possuem valor sintático e semântico relevantes (e.g., substantivos, verbos, adjetivos, adjuntos). Atualmente, existe uma grande variedade de ferramentas para reconhecimento de palavras relevantes em textos. Tais ferramentas possibilitam extrair, desambiguar e classificar informações valiosas a partir de textos de diversas fontes (literatura, notícias, microblogs, etc). Porém, o desempenho computacional e a qualidade dos resultados produzidos por estas ferramentas costumam ser degradados quando o texto usado é oriundo de mídias sociais. Isso acontece porque o texto de mídias sociais apresenta conteúdo informal, possuindo erros ortográficos e gramaticais, acrônimos, gírias, etc. Este trabalho apresenta uma revisão da literatura sobre técnicas e ferramentas para a extração de palavras relevantes de textos e uma análise experimental de ferramentas para anotação morfossintática automática, com foco em mídias sociais, especialmente microblogs, como o Twitter. As ferramentas de PoS Tagging selecionadas são avaliadas em 3 estudos de caso: (i) um benchmarch de classificação morfossintática de textos de tweets com regras ouro para mensurar precisão e cobertura; (ii) uma amostra do corpus histórico do português Tycho Brahe e (iii) um volume considerável de tweets. Com isso pretende-se analisar a cobertura e precisão usando o benchmark além do desempenho em dados reais de um corpus eletrônico e de um microblog. Os resultados mostram evidência experimental de que os resultados das ferramentas de PoS Tagging para textos oriundos de mídias sociais são piores do que para textos de linguagem formal.
Keyword:
Anotação morfossintática
;
extração de informações
;
Processamento de linguagem natural
;
Reconhecimento de palavras relevantes
;
Tweets
URL:
https://repositorio.ufsc.br/xmlui/handle/123456789/171423
BASE
Hide details
Mobile view
All
Catalogues
UB Frankfurt Linguistik
0
IDS Mannheim
0
OLC Linguistik
0
UB Frankfurt Retrokatalog
0
DNB Subject Category Language
0
Institut für Empirische Sprachwissenschaft
0
Leibniz-Centre General Linguistics (ZAS)
0
Bibliographies
BLLDB
0
BDSL
0
IDS Bibliografie zur deutschen Grammatik
0
IDS Bibliografie zur Gesprächsforschung
0
IDS Konnektoren im Deutschen
0
IDS Präpositionen im Deutschen
0
IDS OBELEX meta
0
MPI-SHH Linguistics Collection
0
MPI for Psycholinguistics
0
Linked Open Data catalogues
Annohub
0
Online resources
Link directory
0
Journal directory
0
Database directory
0
Dictionary directory
0
Open access documents
BASE
3
Linguistik-Repository
0
IDS Publikationsserver
0
Online dissertations
0
Language Description Heritage
0
© 2013 - 2024 Lin|gu|is|tik
|
Imprint
|
Privacy Policy
|
Datenschutzeinstellungen ändern