DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5...89
Hits 1 – 20 of 1.772

1
The role of object novelty and pragmatic reasoning in referent selection and word learning (Study 2b) ...
Bleijlevens, Natalie. - : Open Science Framework, 2022
BASE
Show details
2
Semantische Spezialisierung vs. Polysemie : Interpretationsbesonderheiten bei Komplementreduktionen lexikalischer Einheiten
Becke, Tanja von der. - Berlin : De Gruyter, 2021
BDSL
BLLDB
UB Frankfurt Linguistik
Show details
3
Disambiguation of Medical Abbreviations in French with Supervised Methods
In: Studies in Health Technology and Informatics ; https://hal.archives-ouvertes.fr/hal-03335532 ; Studies in Health Technology and Informatics, 2021, ⟨10.3233/shti210171⟩ (2021)
BASE
Show details
4
The role of object novelty and nameability in disambiguation and word learning ...
Bleijlevens, Natalie. - : Open Science Framework, 2021
BASE
Show details
5
Perceptual vowel contrast reduction in Australian English /l/-final rimes
In: Laboratory Phonology: Journal of the Association for Laboratory Phonology; Vol 12, No 1 (2021); 9 ; 1868-6354 (2021)
BASE
Show details
6
Italian Sense Inventory
Poli, Francesca. - : Università di Pisa, 2021. : Istituto di Linguistica Computazionale “A. Zampolli” - Consiglio Nazionale delle Ricerche (ILC-CNR), 2021
BASE
Show details
7
Not this, but that.' Exploring disambiguation in the context of multilingual word learning ...
Repnik, Katharina Maria. - : The University of Edinburgh, 2021
BASE
Show details
8
Word Sense Disambiguation Using Prior Probability Estimation Based on the Korean WordNet
In: Electronics; Volume 10; Issue 23; Pages: 2938 (2021)
BASE
Show details
9
A Knowledge-Based Sense Disambiguation Method to Semantically Enhanced NL Question for Restricted Domain
In: Information ; Volume 12 ; Issue 11 (2021)
BASE
Show details
10
The Integration of Linguistic and Geospatial Features Using Global Context Embedding for Automated Text Geocoding
In: ISPRS International Journal of Geo-Information ; Volume 10 ; Issue 9 (2021)
BASE
Show details
11
Improving the Performance of Vietnamese&ndash ; Korean Neural Machine Translation with Contextual Embedding
In: Applied Sciences ; Volume 11 ; Issue 23 (2021)
BASE
Show details
12
NERWS: Towards Improving Information Retrieval of Digital Library Management System Using Named Entity Recognition and Word Sense
In: Big Data and Cognitive Computing ; Volume 5 ; Issue 4 (2021)
BASE
Show details
13
Verbal Idioms: Concrete Nouns in Abstract Contexts
Wartena, Christian (Prof. Dr.); Charbonnier, Jean. - : Hannover : Hochschule Hannover, 2021
BASE
Show details
14
SemEval-2021 Task 2: Multilingual and Cross-lingual Word-in-Context Disambiguation (MCL-WiC) ...
BASE
Show details
15
SemEval-2021 Task 2: Multilingual and Cross-lingual Word-in-Context Disambiguation (MCL-WiC) ...
BASE
Show details
16
TERMS AND TEXTS: THE FUNCTIONALITY OF EDITORIAL-POLYGRAPHIC TERMS ...
CALARAȘ, Svetlana. - : Zenodo, 2021
BASE
Show details
17
TERMS AND TEXTS: THE FUNCTIONALITY OF EDITORIAL-POLYGRAPHIC TERMS ...
CALARAȘ, Svetlana. - : Zenodo, 2021
BASE
Show details
18
Attentional Orientation and Vocabulary Size
BASE
Show details
19
Not this, but that.' Exploring disambiguation in the context of multilingual word learning
Repnik, Katharina Maria. - : The University of Edinburgh, 2021
BASE
Show details
20
Semantically-oriented text planning for automatic summarization
Casamayor, Gerard. - : Universitat Pompeu Fabra, 2021
In: TDX (Tesis Doctorals en Xarxa) (2021)
Abstract: Text summarization deals with the automatic creation of summaries from one or more documents, either by extracting fragments from the input text or by generating an abstract de novo. Research in recent years has become dominated by a new paradigm where summarization is addressed as a mapping from a sequence of tokens in an input document to a new sequence of tokens summarizing the input. Works following this paradigm apply supervised deep learning methods to learn sequence to sequence models from a large corpus of documents paired with human-crafted summaries. Despite impressive results in automatic quantitative evaluations, this approach to summarization also suffers from a number of drawbacks. One concern is that learned models tend to operate in a black-box fashion that prevents obtaining insights or results from intermediate analysis that could be applied to other tasks -an important consideration in many real-world scenarios where summaries are not the only desired output of a natural language processing system. Another significant drawback is that deep learning methods are largely constrained to languages and types of summary for which abundant corpora containing human authored summaries is available. Albeit researchers are experimenting with transfer learning methods to overcome this problem, it is far from clear how effective these methods are and how to apply them to scenarios where summaries need to adapt to a query or to user preferences. In those cases where it is not practical to learn a sequence to sequence model, it is convenient to fall back to a more traditional formulation of summarization where the input documents are first analyzed, then a summary is planned by selecting and organizing contents, and the final summary is generated either extractively or abstractively --using natural language generation methods in the latter case. By separating linguistic analysis, planning and generation, it becomes possible to apply different approaches to each task. This thesis focuses on the text planning step. Drawing from past research in word sense disambiguation, text summarization and natural language generation, this thesis presents an unsupervised approach to planning the production of summaries. Following the observation that a common strategy for both disambiguation and summarization tasks is to rank candidate items --meanings, text fragments-- we propose a strategy, at the core of our approach, that ranks candidate lexical meanings and individual words in a text. These ranks contribute towards the creation of a graph-based semantic representation from which we select non-redundant contents and organize them for inclusion in the summary. The overall approach is supported by lexicographic databases that provide cross-lingual and cross-domain knowledge, and by textual similarity methods used to compare meanings with each other and with the text. The methods presented in this thesis are tested on two separate tasks, disambiguation of word senses and named entities, and single-document extractive summarization of English texts. The evaluation of the disambiguation task shows that our approach produces useful results for tasks other than summarization, while evaluating in an extractive summarization setting allows us to compare our approach to existing summarization systems. While the results are inconclusive with respect to state-of-the-art in disambiguation and summarization systems, they hint at a large potential for our approach. ; El resum automàtic de textos és una tasca dins del camp d'estudi de processament del llenguatge natural que versa sobre la creació automàtica de resums d'un o més documents, ja sigui extraient fragments del text d'entrada or generant un resum des de zero. La recerca recent en aquesta tasca ha estat dominada per un nou paradigma on el resum és abordat com un mapeig d'una seqüència de paraules en el document d'entrada a una nova seqüència de paraules que resumeixen el document. Els treballs que segueixen aquest paradigma apliquen mètodes d'aprenentatge supervisat profund per tal d'aprendre model seqüència a seqüència a partir d'un gran corpus de documents emparellats amb resums escrits a mà. Tot i els resultats impressionants en avaluacions quantitatives automàtiques, aquesta aproximació al resum automàtic també té alguns inconvenients. Un primer problema és que els models entrenats tendeixen a operar com una caixa negra que impedeix obtenir coneixements o resultats de representacions intermèdies i que puguin ser aplicat a altres tasques. Aquest és un problema important en situacions del món real on els resums no son l'única sortida que s'espera d'un sistema de processament de llenguatge natural. Un altre inconvenient significatiu és que els mètodes d'aprenentatge profund estan limitats a idiomes i tipus de resum pels que existeixen grans corpus amb resums escrits per humans. Tot i que els investigadors experimenten amb mètodes de transferència del coneixement per a superar aquest problema, encara ens trobem lluny de saber com d'efectius son aquests mètodes i com aplicar-los a situacions on els resums s'han d'adaptar a consultes o preferències formulades per l'usuari. En aquells casos en que no és pràctic aprendre models de seqüència a seqüència, convé tornar a una formulació més tradicional del resum automàtic on els documents d'entrada s'analitzen en primer lloc, es planifica el resum tot seleccionant i organitzant continguts i el resum final es genera per extracció o abstracció, fent servir mètodes de generació de llenguatge natural en aquest últim cas. Separar l'anàlisi lingüístic, la planificació i la generació permet aplicar estratègies diferents a cada tasca. Aquesta tesi tracta el pas central de planificació del resum. Inspirant-nos en recerca existent en desambiguació de sentits de mots, resum automàtic de textos i generació de llenguatge natural, aquesta tesi presenta una estratègia no supervisada per a la creació de resums. Seguim l'observació de que el rànquing d'ítems (significats o fragments de text) és un mètode comú per a tasques desambiguació i de resum, i proposem un mètode central per a la nostra estratègia que ordena significats lèxics i paraules d'un text. L'ordre resultant contribueix a la creació d'una representació semàntica en forma de graf des de la que seleccionem continguts no redundants i els organitzem per a la seva inclusió en el resum. L'estratègia general es fonamenta en bases de dades lexicogràfiques que proporcionen coneixement creuat entre múltiples idiomes i àrees temàtiques, i per mètodes de càlcul de similitud entre texts que fem servir per comparar significats entre sí i amb el text. Els mètodes que es presenten en aquesta tesi son posats a prova en dues tasques separades, la desambiguació de sentits de paraula i d'entitats amb nom, i el resum extractiu de documents en anglès. L'avaluació de la desambiguació mostra que la nostra estratègia produeix resultats útils per a tasques més enllà del resum automàtic, mentre que l'avaluació del resum extractiu ens permet comparar el nostre enfocament a sistemes existents de resum automàtic. Tot i que els nostres resultats no representen un avenç significatiu respecte a l'estat de la qüestió en desambiguació i resum automàtic, suggereixen que l'estratègia té un gran potencial.
Keyword: 62; Automatic summarization; Desambiguació de noms d’entitats; Entity linking; Natural language processing; Planificació de textos; Processament del llenguatge natural; Resolució de la polisèmia; Resum automàtic; Text planning; Word sense disambiguation
URL: http://hdl.handle.net/10803/671530
BASE
Hide details

Page: 1 2 3 4 5...89

Catalogues
132
9
218
0
0
1
1
Bibliographies
1.167
1
0
0
0
0
16
0
0
Linked Open Data catalogues
0
Online resources
1
0
0
0
Open access documents
564
2
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern