Home Catalogue search

eng

Refine your search:
- Keyword
- Creator / Publisher
- Year
- Medium:
  - Online (15)
  - Print (1)
- Type
- BLLDB-Access:
  - free (16)
  - subject to license (0)

Search in the Catalogues and Directories






	Sort by
Simple Search

Hits 1 – 16 of 16

1	Stock Market Tweets Data ...
	Taborda, Bruno; de Almeida, Ana; Carlos Dias, José. - : IEEE DataPort, 2021
	BASE
	Show details

2	Detecting psychological sentiments in users from social networks
	Santos, Patrícia de Sousa dos. - 2020
	BASE
	Show details

3	Different Lexicon-Based Approaches to Emotion Identification in Portuguese Tweets (Short Paper) ...
	Filipe, Soraia; Batista, Fernando; Ribeiro, Ricardo. - : Schloss Dagstuhl - Leibniz-Zentrum für Informatik, 2020
	BASE
	Show details

4	Discovery of sensitive data with natural language processing
	Dias, Mariana Rebelo. - 2019
	BASE
	Show details

5	PALbot: a Plug&(Almost)pLay chatbot
	Tai, André Gilberto. - 2019
	BASE
	Show details

6	O Blog como recurso para o ensino de língua inglesa
	Ribeiro, Ricardo Lasek. - 2019
	BASE
	Show details

7	Arquitetura fuzzy hierárquica com defuzzificação adicional de camadas e aplicações ao diagnóstico de qualidade da energia elétrica
	Nolasco, Diego Habib Santos. - : Brasil, 2019. : UFRN, 2019. : PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO, 2019
	BASE
	Show details

8	Sparse distributed representations as word embeddings for language understanding
	Silva, André de Vasconcelos Santos. - 2018
	Abstract: Word embeddings are vector representations of words that capture semantic and syntactic similarities between them. Similar words tend to have closer vector representations in a N dimensional space considering, for instance, Euclidean distance between the points associated with the word vector representations in a continuous vector space. This property, makes word embeddings valuable in several Natural Language Processing tasks, from word analogy and similarity evaluation to the more complex text categorization, summarization or translation tasks. Typically state of the art word embeddings are dense vector representations, with low dimensionality varying from tens to hundreds of floating number dimensions, usually obtained from unsupervised learning on considerable amounts of text data by training and optimizing an objective function of a neural network. This work presents a methodology to derive word embeddings as binary sparse vectors, or word vector representations with high dimensionality, sparse representation and binary features (e.g. composed only by ones and zeros). The proposed methodology tries to overcome some disadvantages associated with state of the art approaches, namely the size of corpus needed for training the model, while presenting comparable evaluations in several Natural Language Processing tasks. Results show that high dimensionality sparse binary vectors representations, obtained from a very limited amount of training data, achieve comparable performances in similarity and categorization intrinsic tasks, whereas in analogy tasks good results are obtained only for nouns categories. Our embeddings outperformed eight state of the art word embeddings in word similarity tasks, and two word embeddings in categorization tasks. ; A designação word embeddings refere-se a representações vetoriais das palavras que capturam as similaridades semânticas e sintáticas entre estas. Palavras similares tendem a ser representadas por vetores próximos num espaço N dimensional considerando, por exemplo, a distância Euclidiana entre os pontos associados a estas representações vetoriais num espaço vetorial contínuo. Esta propriedade, torna as word embeddings importantes em várias tarefas de Processamento Natural da Língua, desde avaliações de analogia e similaridade entre palavras, às mais complexas tarefas de categorização, sumarização e tradução automática de texto. Tipicamente, as word embeddings são constituídas por vetores densos, de dimensionalidade reduzida. São obtidas a partir de aprendizagem não supervisionada, recorrendo a consideráveis quantidades de dados, através da otimização de uma função objetivo de uma rede neuronal. Este trabalho propõe uma metodologia para obter word embeddings constituídas por vetores binários esparsos, ou seja, representações vetoriais das palavras simultaneamente binárias (e.g. compostas apenas por zeros e uns), esparsas e com elevada dimensionalidade. A metodologia proposta tenta superar algumas desvantagens associadas às metodologias do estado da arte, nomeadamente o elevado volume de dados necessário para treinar os modelos, e simultaneamente apresentar resultados comparáveis em várias tarefas de Processamento Natural da Língua. Os resultados deste trabalho mostram que estas representações, obtidas a partir de uma quantidade limitada de dados de treino, obtêm performances consideráveis em tarefas de similaridade e categorização de palavras. Por outro lado, em tarefas de analogia de palavras apenas se obtém resultados consideráveis para a categoria gramatical dos substantivos. As word embeddings obtidas com a metodologia proposta, e comparando com o estado da arte, superaram a performance de oito word embeddings em tarefas de similaridade, e de duas word embeddings em tarefas de categorização de palavras.
	Keyword: Análise vetorial; Binary sparse vectors; Distributional semantic model; Domínio/Área Científica::Engenharia e Tecnologia::Engenharia Eletrotécnica; Eletrónica e Informática; Neural networks; Redes neuronais; Text clustering; Word embedding
	URL: http://hdl.handle.net/10071/18245
	BASE
	Hide details

9	OpenLogos Semantico-Syntactic Knowledge-Rich Bilingual Dictionaries
	Barreiro, Anabela; Batista, Fernando; Ribeiro, Ricardo. - : European Language Resources Association (ELRA), 2018
	BASE
	Show details

10	Revising the Annotation of a Broadcast News Corpus: a Linguistic Approach
	Cabarrão, Vera; Moniz, Helena; Batista, Fernando. - : European Language Resources Association (ELRA), 2018
	BASE
	Show details

11	Computational Processing of the Portuguese Language : 12th International Conference, PROPOR 2016, Tomar, Portugal, July 13-15, 2016, Proceedings
	Marques-Silva, João [Herausgeber]; Ribeiro, Ricardo [Herausgeber]; Quaresma, Paulo [Herausgeber]. - Cham : Springer International Publishing, 2016
	DNB Subject Category Language
	Show details

12	Análise de sentimento em microblogues com base em cascatas de classificacao
	Rebelo, Fernando Manuel Dias. - 2016
	BASE
	Show details

13	The Influence of Context on Dialogue Act Recognition ...
	Ribeiro, Eugénio; Ribeiro, Ricardo; de Matos, David Martins. - : arXiv, 2015
	BASE
	Show details

14	Extending a Single-Document Summarizer to Multi-Document: a Hierarchical Approach ...
	Marujo, Luís; Ribeiro, Ricardo; de Matos, David Martins. - : arXiv, 2015
	BASE
	Show details

15	Towards Using Machine Translation Techniques to Induce Multilingual Lexica of Discourse Markers ...
	Lopes, António; de Matos, David Martins; Cabarrão, Vera. - : arXiv, 2015
	BASE
	Show details

16	Tagging and Shallow Processing of Portuguese: Workshop Notes of TASHA'2003
	Branco, António Horta; Mendes, Amália. - : Department of Informatics, University of Lisbon, 2009
	BASE
	Show details

© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern