DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 51

1
Reconocimiento y clasificación de entidades nombradas en textos legales en español ; Named Entities Recognition and Classification in Spanish Legal Texts
Samy, Doaa. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2021
BASE
Show details
2
On the Detection of False Information: From Rumors to Fake News
Ghanem, Bilal Hisham Hasan. - : Universitat Politècnica de València, 2021
BASE
Show details
3
Descripción, Publicación y Descubrimiento de Recursos Georreferenciados
Beltrán Fonollosa, Arturo. - : Universitat Jaume I, 2020
In: TDX (Tesis Doctorals en Xarxa) (2020)
BASE
Show details
4
El uso de los itinerarios didácticos (SIG) en la educación ambiental
BASE
Show details
5
EusHeidelTime: Time Expression Extraction and Normalisation for Basque ; EusHeidelTime: extracción y normalización de expresiones temporales para el euskera
Altuna Díaz, Begoña; Aranzabe Urruzola, María Jesús; Díaz de Ilarraza Sánchez, Arantza. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2017
BASE
Show details
6
An empirical study of the recreationalexpressive and referential roles of the cell phone among young students and their potential applications to advertising
Llorente Barroso, Carmen; García Guardia, M. Luisa. - : Fundación IS+D para la Investigación Social Avanzada, 2016
BASE
Show details
7
Anotación y representación temporal de tweets multilingües ; Temporal annotation and representation of multilingual tweets
Vázquez-Méndez, Asunción; García-Serrano, Ana. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2015
BASE
Show details
8
La lectura de noticias de los informativos en la radio y la televisión: análisis de la prosodia y la emisión de la voz
Álvarez del Valle, María Sol. - : Universidad Complutense de Madrid, 2015
BASE
Show details
9
Recuperación de información en Persa: revisión crítica y propuestas de mejora
Abstract: Los principales modelos y técnicas propuestas por los investigadores en la recuperación de información dependen en mayor o menor medida del idioma, tanto de los documentos como de las consultas que se formulan. Al respecto existen muchos estudios, desde el procesamiento del texto hasta los modelos de recuperación, para las lenguas occidentales o predominantes como el inglés. Sin embargo, las lenguas minoritarias como la lengua persa no han sido suficientemente tratadas en los sistemas de RI tanto tradicional como Web y deberían ser mejoradas desarrollando algoritmos y técnicas que consideran las características de esas lenguas. Además, la diferencia morfológica y lingüística de persa frente al inglés en todos sus niveles no permite una extrapolación al idioma persa de los resultados obtenidos para el inglés, demandando la realización de trabajos específicos. El objetivo principal de esta tesis es analizar la recuperación de información en persa y poner de manifiesto los factores que afectan a la eficiencia en los sistemas de recuperación de información con documentos persas y dar propuestas para mejorar la eficiencia de la recuperación de documentos relevantes. Los resultados obtenidos por nuestros experimentos revelan que la mala representación de documentos es el gran desafío que presenta la lengua persa en un sistema de recuperación de información. La representación de documentos es el conjunto de operaciones que se hacen sobre el contenido de un documento desde su creación hasta su indexación. Las diferentes formas de la escritura, ambigüedades en el texto escrito, la dispersión en posición alfabética diferente y no estándar de la ortografía son los principales problemas que hacen necesaria una pre-normalización o estandarización del texto para cumplir con los criterios de un sistema de RI. La segmentación del texto y la definición del límite de las palabras son tareas muy difíciles en persa. Hay de uno a cuatro formas de escribir un carácter alfabético según su posición en una palabra. Cada forma puede ser inicial, media, final y aislada. Hay varias formas de escribir textos persas que difieren en el estilo de escritura de palabras usando o eliminando los espacios dentro o entre las palabras utilizando diversas formas de caracteres. Entonces la correcta tokenizatión y la conversión de estas formas y estilos en una única norma es un paso necesario en la construcción de los sistemas de RI con documentos en persa. En la lengua persa, las palabras se construyen generalmente a partir de la forma imperativa de los verbos. Por lo tanto, desde un punto de vista de la lingüística, la primera etapa para extraer la raíz es encontrar el modo imperativo de la palabra. En general, no es fácil obtener el modo imperativo ya que hay muchos infinitivos irregulares. La forma imperativa del infinitivo irregular se basa en cómo se escuchan o se usan las palabras. En este caso, se necesita buscar el modo imperativo en el léxico. Además, la diversidad de formas plurales, plurales irregulares y las palabras no plurales terminando con los signos plurales son algunos de los retos en la construcción de lematizadores para la lengua persa. Otro objetivo de esta tesis es la evaluación del rendimiento y calidad de los buscadores de web frente a los documentos persas, en particular, de Google que es utilizado por el 92% de los usuarios iraníes. Los resultados obtenidos han destacado que el buscador Google considera las palabras vacías persas como palabras claves del contenido de un documento persa. Además, la tokenización del texto no realiza correctamente la separación adecuada de las palabras y la lematización contiene muchos errores. En conclusión, Google debe mejorar las operaciones que corresponden a la representación de documentos persas teniendo en cuenta de la estructura y gramática de la lengua persa. Analizando los trabajos previos, hemos constatado que no hay ninguna investigación que consiga en identificar automáticamente las palabras vacías en un sistema de RI. Por lo tanto, la última aportación de este trabajo es desarrollar un método automático que permita identificar las palabras vacías para sistemas de RI con documentos persas. Nuestro método está basado en los modelos estadísticos y en el modelo de información. El modelo estadístico extrae las palabras vacías teniendo en cuenta la distribución de estas palabras en un corpus y en cada documento del corpus. El modelo de información mide el significado de una palabra en el texto mediante el uso de la teoría de la información. ; Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos)
Keyword: Persa (Lengua); Recuperación de la información; Sistemas de información
URL: http://uvadoc.uva.es/handle/10324/16008
https://doi.org/10.35376/10324/16008
BASE
Hide details
10
Descripción y evaluación de un sistema de extracción de definiciones para el catalán ; Description and Evaluation of a Definition Extraction System for Catalan
Espinosa-Anke, Luis; Saggion, Horacio. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2014
BASE
Show details
11
Methodology and evaluation of the Galician WordNet expansion with the WN-Toolkit ; Metodología y evaluación de la expansión del WordNet del gallego con WN-Toolkit
Gómez Guinovart, Xavier; Oliver González, Antoni. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2014
BASE
Show details
12
Fénix: a flexible information exchange data model for natural language processing ; Fénix: un modelo de datos flexible para el intercambio de información en procesamiento del lenguaje natural
Gómez, José M.; Tomás, David; Moreda, Paloma. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2014
BASE
Show details
13
Descripción, Publicación y Descubrimiento de Recursos Georreferenciados
Beltrán Fonollosa, Arturo. - : Universitat Jaume I, 2013
In: TDX (Tesis Doctorals en Xarxa) (2013)
BASE
Show details
14
Información lingüística en recuperación de imágenes multilingüe ; Linguistic information in multilingual image retrieval
Fresno Fernández, Víctor; Hernández-Aranda, David. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2013
BASE
Show details
15
On the mono- and cross-language detection of text re-use and plagiarism ; Detección de texto reutilizado y plagio monolingüe y translingüe
Barrón Cedeño, Alberto. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2013
BASE
Show details
16
A semantic approach to temporal information processing ; Aproximación semántica al procesamiento de la información temporal
Llorens Martínez, Héctor. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2012
BASE
Show details
17
A simple approach to use bilingual information sources for word alignment ; Una manera sencilla para usar fuentes de información bilingüe para el alineamiento de palabras
Esplà-Gomis, Miquel; Sánchez-Martínez, Felipe; Forcada, Mikel L.. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2012
BASE
Show details
18
Desarrollo de un sistema de información sobre contenido cinematográfico basado en VoiceXML
BASE
Show details
19
Expansión fonética de la consulta para la recuperación de información en documentos hablados ; Phonetic query expansion for spoken document retrieval
Reyes Barragán, Alejandro; Villaseñor Pineda, Luis; Montes y Gómez, Manuel. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2011
BASE
Show details
20
Parallel corpus alignment at the document, sentence and vocabulary levels ; Alineación de corpus paralelo a nivel de documento, de oración y de vocabulario
Nazar, Rogelio. - : Sociedad Española para el Procesamiento del Lenguaje Natural, 2011
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
51
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern