DE eng

Search in the Catalogues and Directories

Hits 1 – 2 of 2

1
Hubness in the protein sequence universe ...
Feldbauer, Roman Vinzenz. - : (:none), 2020
Abstract: This work investigates the influence of “hubness” on the protein sequence universe. Proteins are important biomolecules that play major roles in virtually all cellular functions. A vast majority of bioinformatic experiments on proteins are performed on the level of amino acid sequences, and rely on some measure of sequence similarity. The entirety of all extinct, extent, and possible protein sequences is referred to as the protein sequence universe. Hubness is a phenomenon of high-dimensional spaces, detrimental to a variety of machine learning tasks. Originally described in music similarity databases, hubness has since been recognized as a general “curse of dimensionality”, relevant to various application domains, including time series analysis, and natural language processing. Hubness is, consequently, hypothesized to be detrimental to biological tasks, such as sequence classification or clustering. Hubness reduction methods are comprehensively evaluated with respect to learning performance improvements. ... : In dieser Arbeit wird der Einfluss von „Hubness“ auf das Proteinsequenzuniversum untersucht. Proteine sind essentielle Biomoleküle, die wichtige Rollen in allen zellulären Prozessen übernehmen. Ein Großteil aller bioinformatischen Experimente zu Proteinen operieren auf Ebene der Aminosäuresequenzen, und benötigen ein Maß für Sequenzähnlichkeit. Die Gesamtheit aller Proteine wird als Proteinsequenzuniversum bezeichnet. „Hubness“ ist ein Phänomen hochdimensionaler Räume, das eine Vielzahl von Methoden des maschinellen Lernens negativ beeinflussen kann. Das Phänomen wurde ursprünglich im Kontext von Musikähnlichkeitsdatenbanken beschrieben. Rezente Forschung erkennt Hubness hingegen als eine generelle Eigenschaft intrinsisch hochdimensionaler Räume, die Daten in verschiedensten Anwendungsdomänen beeinflusst, darunter Zeitreihenanalyse oder die Verarbeitung natürlicher Sprache in der Computerlinguistik. Vor diesem Hintergrund wird die Hypothese aufgestellt, dass auch biologische Fragestellungen negativ durch ...
URL: https://othes.univie.ac.at/64427/
https://dx.doi.org/10.25365/thesis.64427
BASE
Hide details
2
Hubness in the protein sequence universe
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
2
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern