DE eng

Search in the Catalogues and Directories

Page: 1 2 3
Hits 1 – 20 of 42

1
Common Language and International Trade
BASE
Show details
2
On the Efficiency of German Growth Forecasts: An Empirical Analysis Using Quantile Random Forests
Foltas, Alexander; Pierdzioch, Christian. - : Humboldt-Universität zu Berlin, 2020
BASE
Show details
3
Business-Cycle Reports and the Efficiency of Macroeconomic Forecasts for Germany
Foltas, Alexander; Pierdzioch, Christian. - : Humboldt-Universität zu Berlin, 2020
BASE
Show details
4
Linguistic Fragmentation at the Micro-Level: Economic Returns to Speaking the Right Language(s) in a Multilinguistic Society
Aldashev, Alisher; Danzer, Alexander M.. - : ROUTLEDGE JOURNALS, TAYLOR & FRANCIS LTD, 2020
BASE
Show details
5
Dynamics of investor communication in equity crowdfunding
Dorfleitner, Gregor; Hornuf, Lars; Weber, Martina. - : SPRINGER HEIDELBERG, 2018
BASE
Show details
6
Face value of companies: deep learning for nonverbal communication
Burgard, Sophie. - : Humboldt-Universität zu Berlin, 2017
BASE
Show details
7
The Term ´Non-financial Information´- A Semantic Analysis of a Key Feature of Current and Future Corporate Reporting
Haller, Axel; Link, Michael; Groß, Tobias. - : Routledge Taylor & Francis Group, 2017
BASE
Show details
8
Distillation of News Flow intoAnalysis of Stock Reactions
Zhang, Junni L.; Härdle, Wolfgang K.; Chen, Cathy Y.. - : Humboldt-Universität zu Berlin, Wirtschaftswissenschaftliche Fakultät, 2015
BASE
Show details
9
Theologische Einflüsse auf die deutsche Nationalökonomie im 19. und 20. Jahrhundert – drei Fallbeispiele
Petersen, Tim. - : Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky, 2015
BASE
Show details
10
A Fuzzy Metric for Currency in the Context of Big Data
BASE
Show details
11
German valuation: Review of methods and legal framework
Schnaidt, Tobias; Sebastian, Steffen P.. - : MCB Univ. Press; Emerald, 2012
BASE
Show details
12
USA
Haller, Axel; Wehrfritz, Martin. - : Oldenbourg Verlag München, 2011
BASE
Show details
13
Wertschöpfungsrechnung
Haller, Axel. - : Oldenbourg Verlag München, 2011
BASE
Show details
14
Rückstellungen
Coenenberg, Adolf Gerhard; Haller, Axel; Wittmann, Marco. - : Oldenbourg Verlag München, 2011
BASE
Show details
15
Bilanztheorien
Coenenberg, Adolf Gerhard; Haller, Axel; Blab, Daniel. - : Oldenbourg Verlag München, 2011
BASE
Show details
16
Quantifying High-Frequency Market Reactions to Real-Time News Sentiment Announcements
Groß-Klußmann, Axel; Hautsch, Nikolaus. - : Humboldt-Universität zu Berlin, Wirtschaftswissenschaftliche Fakultät, 2009
BASE
Show details
17
Tracking domain knowledge based on segmented textual sources
Kalledat, Tobias. - : Humboldt-Universität zu Berlin, Wirtschaftswissenschaftliche Fakultät, 2009
Abstract: Die hier vorliegende Forschungsarbeit hat zum Ziel, Erkenntnisse über den Einfluss der Vorverarbeitung auf die Ergebnisse der Wissensgenerierung zu gewinnen und konkrete Handlungsempfehlungen für die geeignete Vorverarbeitung von Textkorpora in Text Data Mining (TDM) Vorhaben zu geben. Der Fokus liegt dabei auf der Extraktion und der Verfolgung von Konzepten innerhalb bestimmter Wissensdomänen mit Hilfe eines methodischen Ansatzes, der auf der waagerechten und senkrechten Segmentierung von Korpora basiert. Ergebnis sind zeitlich segmentierte Teilkorpora, welche die Persistenzeigenschaft der enthaltenen Terme widerspiegeln. Innerhalb jedes zeitlich segmentierten Teilkorpus können jeweils Cluster von Termen gebildet werden, wobei eines diejenigen Terme enthält, die bezogen auf das Gesamtkorpus nicht persistent sind und das andere Cluster diejenigen, die in allen zeitlichen Segmenten vorkommen. Auf Grundlage einfacher Häufigkeitsmaße kann gezeigt werden, dass allein die statistische Qualität eines einzelnen Korpus es erlaubt, die Vorverarbeitungsqualität zu messen. Vergleichskorpora sind nicht notwendig. Die Zeitreihen der Häufigkeitsmaße zeigen signifikante negative Korrelationen zwischen dem Cluster von Termen, die permanent auftreten, und demjenigen das die Terme enthält, die nicht persistent in allen zeitlichen Segmenten des Korpus vorkommen. Dies trifft ausschließlich auf das optimal vorverarbeitete Korpus zu und findet sich nicht in den anderen Test Sets, deren Vorverarbeitungsqualität gering war. Werden die häufigsten Terme unter Verwendung domänenspezifischer Taxonomien zu Konzepten gruppiert, zeigt sich eine signifikante negative Korrelation zwischen der Anzahl unterschiedlicher Terme pro Zeitsegment und den einer Taxonomie zugeordneten Termen. Dies trifft wiederum nur für das Korpus mit hoher Vorverarbeitungsqualität zu. Eine semantische Analyse auf einem mit Hilfe einer Schwellenwert basierenden TDM Methode aufbereiteten Datenbestand ergab signifikant unterschiedliche Resultate an generiertem Wissen, abhängig von der Qualität der Datenvorverarbeitung. Mit den in dieser Forschungsarbeit vorgestellten Methoden und Maßzahlen ist sowohl die Qualität der verwendeten Quellkorpora, als auch die Qualität der angewandten Taxonomien messbar. Basierend auf diesen Erkenntnissen werden Indikatoren für die Messung und Bewertung von Korpora und Taxonomien entwickelt sowie Empfehlungen für eine dem Ziel des nachfolgenden Analyseprozesses adäquate Vorverarbeitung gegeben. ; The research work available here has the goal of analysing the influence of pre-processing on the results of the generation of knowledge and of giving concrete recommendations for action for suitable pre-processing of text corpora in TDM. The research introduced here focuses on the extraction and tracking of concepts within certain knowledge domains using an approach of horizontally (timeline) and vertically (persistence of terms) segmenting of corpora. The result is a set of segmented corpora according to the timeline. Within each timeline segment clusters of concepts can be built according to their persistence quality in relation to each single time-based corpus segment and to the whole corpus. Based on a simple frequency measure it can be shown that only the statistical quality of a single corpus allows measuring the pre-processing quality. It is not necessary to use comparison corpora. The time series of the frequency measure have significant negative correlations between the two clusters of concepts that occur permanently and others that vary within an optimal pre-processed corpus. This was found to be the opposite in every other test set that was pre-processed with lower quality. The most frequent terms were grouped into concepts by the use of domain-specific taxonomies. A significant negative correlation was found between the time series of different terms per yearly corpus segments and the terms assigned to taxonomy for corpora with high quality level of pre-processing. A semantic analysis based on a simple TDM method with significant frequency threshold measures resulted in significant different knowledge extracted from corpora with different qualities of pre-processing. With measures introduced in this research it is possible to measure the quality of applied taxonomy. Rules for the measuring of corpus as well as taxonomy quality were derived from these results and advice suggested for the appropriate level of pre-processing.
Keyword: 17 Wirtschaft; 330 Wirtschaft; Computational Linguistics; Computerlinguistik; Corpus Linguistics; Corpus Measures; Data Pre-processing; Datenvorverarbeitung; ddc:330; Knowledge Extraction; Korpuskennzahlen; Korpuslinguistik; Pre-processing Quality; QP 345; Text Data Mining; Vorverarbeitungsqualität; Wissensextraktion
URN: urn:nbn:de:kobv:11-10098785
URL: http://edoc.hu-berlin.de/18452/16577
https://doi.org/10.18452/15925
BASE
Hide details
18
BWL-Lexikon
Bea, Franz X.; Helm, Roland; Schweitzer, Marcell. - : Lucius & Lucius, 2009
BASE
Show details
19
Abschlusserstellung nach US-GAAP
Haller, Axel; Ernstberger, Jürgen. - : Oldenbourg, 2008
BASE
Show details
20
Zahlungsverkehrssystem
Bartmann, Dieter. - : Oldenbourg, 2008
BASE
Show details

Page: 1 2 3

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
42
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern