1 |
REDES: Reconocimiento de Entidades Digitales: Enriquecimiento y Seguimiento mediante Tecnologías del Lenguaje ; REDES: Digital Entities Recognition: Enrichment and Tracking by Language Technologies
|
|
|
|
BASE
|
|
Show details
|
|
2 |
TextMess 2.0: las tecnologías del lenguaje humano ante los nuevos retos de la comunicación digital ; TextMess 2.0: the new digital media challenges facing human language technologies
|
|
|
|
BASE
|
|
Show details
|
|
3 |
Técnicas de clasificación de opiniones aplicadas a un corpus en español ; Opinion classification techniques applied to a Spanish corpus
|
|
|
|
Abstract:
El análisis de sentimientos es una nueva tarea que combina técnicas de minería de texto y Procesamiento del Lenguaje Natural (PLN). Aunque existen ya varios trabajos relacionados con la temática, la mayoría de ellos únicamente usan textos en inglés. Sin embargo, el número de páginas webs, blogs u opiniones vertidas en Internet que usan cualquier idioma, no sólo el inglés, crece exponencialmente. De hecho, otros idiomas como el español incrementan su presencia en la red día a día. Es por ello que en este trabajo se presenta un estudio experimental sobre un corpus de opiniones sobre películas escrito en español. Nuestro objetivo principal consiste en comprobar cómo se comportan varios clasificadores entrenados para determinar la polaridad de las opiniones en dicho corpus. Para ello hemos usado dos clasificadores (SVM y Naïve Bayes) variando además distintos parámetros como el esquema de pesado o la utilización o no de stopper y stemmer. Los experimentos realizados muestran que SVM se comporta mejor que Naïve Bayes y que el uso de stopper y stemmer también mejora los resultados. ; Sentiment analysis is a new challenging task related to Text Mining and Natural Language Processing (NLP). Although there are some current works, most of them only focus on English texts. However, web pages, blogs and opinions on the Internet are increasing every day in any language and not only in English. Other language like Spanish is increasingly present so we have carried out an experimental study with a Spanish films reviews corpus. Our main goal is to check the results obtained using several classifiers trained in order to determinate the opinion polarity. We have tested two classification algorithms (SVM, Naïve Bayes) and several weighting schemes and different linguistic preprocessing (stopper and stemmer). The accomplished experiments show that SVM works better than Naïve Bayes. In addition, the stopper and stemmer also obtain a slight improvement. ; Esta investigación ha sido parcialmente financiada por el Fondo Europeo de Desarrollo Regional (FEDER), proyecto TEXT-COOL 2.0 (TIN2009-13391-C04-02) del Gobierno Español, por la Junta de Andalucía, proyecto GeOasis (P08-TIC-41999), y por el Instituto de Estudios Giennenses, proyecto RFC/IEG2010.
|
|
Keyword:
Análisis de sentimientos; Clasificación de la polaridad; Corpus de opiniones en español; Lenguajes y Sistemas Informáticos; Minería de opiniones; Opinion corpus in Spanish; Opinion mining; Sentiment polarity classification; Sentimental analysis
|
|
URL: http://hdl.handle.net/10045/18524
|
|
BASE
|
|
Hide details
|
|
4 |
TextMess 2.0: Las Tecnologías del Lenguaje Humano ante los nuevos retos de la comunicación digital
|
|
|
|
BASE
|
|
Show details
|
|
5 |
Geo-NER: un reconocedor de entidades geográficas para inglés basado en GeoNames y Wikipedia ; Geo-NER: an English geographic entity recognizer based on GeoNames and Wikipedia
|
|
|
|
BASE
|
|
Show details
|
|
6 |
TEXT-MESS: Intelligent, Interactive and Multilingual Text Mining based on Human Language Technologies, TIN2006-15265-C06
|
|
|
|
BASE
|
|
Show details
|
|
7 |
Sistemas de recuperación de información geográfica multilingües en CLEF ; Multilingual geographical information retrieval systems in CLEF
|
|
|
|
BASE
|
|
Show details
|
|
8 |
Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje
|
|
|
|
BASE
|
|
Show details
|
|
9 |
Generación de un tesauro de similitud multilingüe a partir de un corpus comparable aplicado a CLIR
|
|
|
|
BASE
|
|
Show details
|
|
|
|