21 |
Pluricentric languages : automatic identification and linguistic variation ; Plurizentrische Sprachen : automatische Spracherkennung und linguistische Variation
|
|
|
|
BASE
|
|
Show details
|
|
22 |
An Information theoretic approach to production and comprehension of discourse markers ...
|
|
|
|
BASE
|
|
Show details
|
|
23 |
Digital humanities: centres and peripheries
|
|
|
|
In: Historical Social Research ; 37 ; 3 ; 46-58 ; Kontroversen um die Digitalen Geisteswissenschaften / Controversies around the digital humanities (2015)
|
|
BASE
|
|
Show details
|
|
24 |
Identifying events using computer-assisted text analysis
|
|
|
|
In: Social Science Computer Review ; 26 ; 4 ; 483-497 (2015)
|
|
BASE
|
|
Show details
|
|
25 |
Controversies around the digital humanities: an agenda
|
|
|
|
In: Historical Social Research ; 37 ; 3 ; 7-23 ; Kontroversen um die Digitalen Geisteswissenschaften / Controversies around the digital humanities (2015)
|
|
BASE
|
|
Show details
|
|
26 |
An Information theoretic approach to production and comprehension of discourse markers
|
|
|
|
BASE
|
|
Show details
|
|
27 |
Hypertextuality, complexity, creativity: using linguistic software tools to uncover new information about the food and drink of historic Mayans
|
|
|
|
In: Forum Qualitative Sozialforschung / Forum: Qualitative Social Research ; 13 ; 2 ; 33 ; Rechnergestützte Datenanalyse: verschiedene Kontexte, verschiedene Praktiken / Qualitative computing: diverse worlds and research practices (2013)
|
|
BASE
|
|
Show details
|
|
28 |
The journal project: qualitative computing and the technology/ aesthetics divide in qualitative research
|
|
|
|
In: Forum Qualitative Sozialforschung / Forum: Qualitative Social Research ; 13 ; 2 ; 30 ; Rechnergestützte Datenanalyse: verschiedene Kontexte, verschiedene Praktiken / Qualitative computing: diverse worlds and research practices (2013)
|
|
BASE
|
|
Show details
|
|
29 |
Computer simulation experiments in phonetics and phonology : simulation technology in linguistic research on human speech ; Computersimulationsexperimente in Phonetik und Phonologie
|
|
|
|
BASE
|
|
Show details
|
|
30 |
Word meaning in context : a probabilistic model and its application to question answering ...
|
|
|
|
BASE
|
|
Show details
|
|
31 |
Hybrid approaches for sentiment analysis ... : Hybridansätze für die Sentimentanalyse ...
|
|
|
|
BASE
|
|
Show details
|
|
32 |
Hybrid approaches for sentiment analysis ; Hybridansätze für die Sentimentanalyse
|
|
|
|
Abstract:
Sentiment Analysis is the task of extracting and classifying opinionated content in natural language texts. Common subtasks are the distinction between opinionated and factual texts, the classification of polarity in opinionated texts, and the extraction of the participating entities of an opinion(-event), i.e. the source from which an opinion emanates and the target towards which it is directed. With the emerging Web 2.0 which describes the shift towards a highly user-interactive communication medium, the amount of subjective content on the World Wide Web is steadily increasing. Thus, there is a growing need for automatically processing this type of content which is provided by sentiment analysis. Both natural language processing, which is the task of providing computational methods for the analysis and representation of natural language, and machine learning, which is the task of building task-specific classification models on the basis of empirical data, may be instrumental in mastering the challenges of the automatic sentiment analysis of written text. Many problems in sentiment analysis have been proposed to be solved with machine learning methods exclusively using a fairly low-level feature design, such as bag of words, containing little linguistic information. In this thesis, we examine the effectiveness of linguistic features in various subtasks of sentiment analysis. Thus, we heavily draw from the insights gained by natural language processing. The application of linguistic features can be applied on various classification methods, be it in rule-based classification, where the linguistic features are directly encoded as a classifier, in supervised machine learning, where these features complement basic low-level features, or in bootstrapping methods, where these features form a rule-based classifier generating a labeled training set from which a supervised classifier can be trained. In this thesis, we will in particular focus on scenarios where the combination of linguistic features and machine learning methods is effective. We will look at common text classification tasks, both coarse-grained and fine-grained, and extraction tasks. ; Sentimentanalyse beschreibt die Aufgabe, Meinungen aus natürlich-sprachlichem Text zu extrahieren bzw. deren Inhalt zu klassifizieren. Übliche Teilaufgaben sind die Unterscheidung zwischen sachbezogenem Text und Meinung, die Klassifikation von Polarität (einer Meinung), sowie die Extraktion von Entitäten, die an einer Meinung beteiligt sind, d.h. der Ursprung, von dem eine Meinung ausgeht, und das Ziel, auf das sich eine Meinung richtet. Mit dem Aufkommen des Web 2.0, das den Übergang des Internets zu einem hochgradig interaktiven Kommunikationsmedium beschreibt, ist parallel auch der Anteil an subjektiven Inhalten im Netz gestiegen. Dadurch wächst logischerweise auch der Bedarf an automatischen Verfahren, die die Aufgaben der Sentimentanalyse unterstützen. Bei der Bewältigung der automatischen Sentimentanalyse geschriebener Sprache sind sowohl die natürliche Sprachverarbeitung, die berechenbare Modelle für die Analyse und Repräsentation natürlicher Sprache bereitstellt, als auch maschinelle Lernverfahren, die aufgabenspezifische Klassifikationsmodelle auf der Basis von empirischen Daten liefern, hilfreich. Viele Probleme in der Sentimentanalyse können mit Standardmethoden aus dem maschinellen Lernen, die sich hauptsächlich auf elementares Merkmalsdesign stützen (wie z.B. Bag of Words, die nur sehr begrenzt linguistische Information kodieren), gelöst werden. In dieser Dissertation soll die Nutzbarkeit von linguistischen Merkmalen in unterschiedlichen Teilaufgaben in der Sentimentanalyse untersucht werden. Hierbei stützen wir uns vorwiegend auf Erkenntnisse der natürlichen Sprachverarbeitung. Linguistische Merkmale können in den unterschiedlichsten Klassifikationsmethoden Anwendung finden, sei es in rein regelbasierten Klassifikationsverfahren, bei denen die Merkmale direkt als Klassifikator kodiert werden, in überwachten Lernverfahren, bei denen diese Merkmale Standardmerkmale (z.B. Bag of Words) ergänzen, oder aber auch in Bootstrappingverfahren, bei denen die Merkmale Bestandteil eines regelbasierten Klassifikators sein können, der ein annotiertes Trainingsset generiert, auf dem wiederum einfache überwachte Klassifikatoren trainiert werden können. In dieser Dissertation werden wir uns vorwiegend auf Szenarien beschränken, bei denen eine Kombination aus linguistischen Merkmalen und maschinellem Lernen vorteilhaft ist. Wir werden Textklassifikationsaufgaben (sowohl grob-körnig als auch fein-körnig) und Extraktionsaufgaben betrachten.
|
|
Keyword:
computational linguistics; Computerlinguistik; ddc:400; information extraction; machine learning; Maschinelles Lernen; sentiment analysis; text classification
|
|
URL: https://doi.org/10.22028/D291-22705 http://nbn-resolving.org/urn:nbn:de:bsz:291-scidok-38820
|
|
BASE
|
|
Hide details
|
|
33 |
Word meaning in context : a probabilistic model and its application to question answering
|
|
|
|
BASE
|
|
Show details
|
|
34 |
Graph-based methods for large-scale multilingual knowledge integration ... : Graphenbasierte Methoden zur multilingualen Wissensintegration ...
|
|
|
|
BASE
|
|
Show details
|
|
36 |
Graph-based methods for large-scale multilingual knowledge integration ; Graphenbasierte Methoden zur multilingualen Wissensintegration
|
|
|
|
BASE
|
|
Show details
|
|
37 |
German clause-embedding predicates : an extraction and classification approach ; Deutsche Prädikate mit Nebensätzen : ihre Extraktion und Klassifikation
|
|
|
|
BASE
|
|
Show details
|
|
38 |
Annotating Discourse Anaphora
|
|
|
|
In: Proceedings of the Workshop " Third Linguistic Annotation Workshop ", LAW III, ACL-IJCNLP 2009, Suntec, Singapore, 6 - 7 August 2009. - S. 166-169 (2009)
|
|
BASE
|
|
Show details
|
|
39 |
The Role of the German Vorfeld for Local Coherence : a pilot study
|
|
|
|
In: Von der Form zur Bedeutung : Texte automatisch verarbeiten, Proceedings of the biennial GSCL conference 2009 / Chiarcos, Christian et al. (Hrsg.). - Tübingen : Narr, 2009. - S. 69-80. - ISBN 978-3-8233-6511-2 (2009)
|
|
BASE
|
|
Show details
|
|
40 |
Parameterized type expansion in the feature structure formalism TDL ...
|
|
|
|
BASE
|
|
Show details
|
|
|
|