DE eng

Search in the Catalogues and Directories

Page: 1 2 3 4 5 6
Hits 1 – 20 of 106

1
Visual training could be useful for improving reading capabilities in dyslexia
In: ISSN: 2162-2965 ; EISSN: 2162-2973 ; Applied Neuropsychology: Child ; https://hal.parisnanterre.fr//hal-03144384 ; Applied Neuropsychology: Child, Taylor & Francis, 2019, pp.1-10. ⟨10.1080/21622965.2019.1646649⟩ (2019)
BASE
Show details
2
Hållbar kraftförsörjning av signalanläggningar : En undersökning av Roslagsbanans signalsäkerhetsutrustning ; Sustainable power supply of signalling facilities
Strandberg, Leo; Mirovic, Zivojin. - : KTH, Hälsoinformatik och logistik, 2018
BASE
Show details
3
What is Developmental Dyslexia?
Stein, J. - 2018
BASE
Show details
4
Speech dereverberation in noisy environments using time-frequency domain signal models ; Enthallung von Sprachsignalen unter Einfluss von Störgeräuschen mittels Signalmodellen im Zeit-Frequenz-Bereich
Abstract: Reverberation is the sum of reflected sound waves and is present in any conventional room. Speech communication devices such as mobile phones in hands-free mode, tablets, smart TVs, teleconferencing systems, hearing aids, voice-controlled systems, etc. use one or more microphones to pick up the desired speech signals. When the microphones are not in the proximity of the desired source, strong reverberation and noise can degrade the signal quality at the microphones and can impair the intelligibility and the performance of automatic speech recognizers. Therefore, it is a highly demanded task to process the microphone signals such that reverberation and noise are reduced. The process of reducing or removing reverberation from recorded signals is called dereverberation. As dereverberation is usually a completely blind problem, where the only available information are the microphone signals, and as the acoustic scenario can be non-stationary, dereverberation is one of the most challenging tasks in speech enhancement. While in theory perfect dereverberation can be achieved by inverse filtering under some conditions and with knowledge of the room impulse response (RIR), in practice the blind identification of the RIR is not sufficiently accurate and robust in time-varying and noisy acoustic conditions. Therefore, successful dereverberation methods have been developed in the time-frequency domain that often relax the problem to partial dereverberation, where mainly the late reverberation tail is reduced. Although in the recent years some robust and efficient methods have been proposed that can reduce the late reverberation tail to some extent, it is still challenging to obtain a dereverberated signal with high audio quality, without speech distortion and artifacts using real-time processing techniques with minimal delay. In this thesis, we focus on robust dereverberation methods for online processing as required in real-time speech communication systems. To achieve dereverberation, two main aspects can be exploited: temporal and spatial information. Firstly, reverberation introduces correlation over time and extends the duration of phonemes or sound events. By exploiting temporal correlation, filters can be derived to extract the desired speech signal or to reduce the reverberation. Secondly, by using multiple microphones, spatial information can be exploited to distinguish between the coherent direct sound and the reverberation, which has a spatially diffuse property. To extract the coherent sound, spatial filters, also known as beamformers, can be used that combine the microphone signals such that only sound from a certain direction is extracted, whereas sound from other directions and diffuse sound components are suppressed. In this thesis, a variety of signal models is exploited to model reverberation using temporal and spatial aspects. All considered signal models are defined in the short-time Fourier transform (STFT) domain, which is widely used in many speech and audio processing techniques, therefore allowing simple integration with other existing techniques. In particular, we utilize a narrowband moving average model, a narrowband multichannel autoregressive model, and a spatial coherence based model. For each of these three signal models, a method for dereverberation and noise reduction is proposed. The first main contribution is a single-channel estimator of the late reverberation power spectral density (PSD), which is required to compute a Wiener filter reducing reverberation and noise. The proposed reverberation PSD estimator is based on a narrowband moving average model using relative convolutive transfer functions (RCTFs). In contrast to other single-channel reverberation PSD estimators, the proposed estimator explicitly models time-varying acoustic conditions and additive noise, and requires no prior information on the room acoustics like the reverberation time or the direct-to-reverberation ratio (DRR). The second main contribution is a multichannel reverberation PSD estimator based on the spatial coherence, where the reverberation is modeled as an additive diffuse sound component with a time-invariant spatial coherence. In the multichannel case, the desired signal can be estimated by a multichannel Wiener filter (MWF) that requires the reverberation PSD. To mitigate speech distortion and artifacts, a generalized method to control the attenuation of reverberation and noise at the output of a MWF independently is proposed. As there exists a wide variety of such single- and multichannel reverberation PSD estimators, an extensive overview, comparison and benchmark of state-of-the-art estimators is provided. As a cure for a common weakness of all reverberation PSD estimators, a bias compensation for high DRRs is proposed. The third main contribution is an online solution for dereverberation and noise reduction based on a narrowband multichannel autoregressive (MAR) signal model for time-varying acoustic environments. Using this model, the late reverberation is predicted from previous reverberant speech samples using the MAR coefficients, and is then subtracted from the current reverberant signal. A main novelty of this approach is a parallel estimation structure, that allows to obtain causal estimates of time-varying MAR coefficients in noisy environments. In addition, a method to control the amount of reverberation and noise reduction independently is proposed. In the last part of this thesis, the three proposed dereverberation systems are compared using objective measures, a listening test, and an automatic speech recognition system. It is shown that the proposed algorithms efficiently reduce reverberation and noise, and can be directly applied in speech communication devices. The theoretical overview and the evaluation shows that each dereverberation method has different strengths and limitations. By considering these algorithms as representatives of their dereverberation class, useful insights and conclusions are provided that can help for the choice of a dereverberation method for a specific application. ; Akustischer Hall ist die Summe von reflektierten Schallwellen und ist jedem üblichen Raum vorhanden. Geräte zur Sprachkommunikation, z. B. Mobiltelefone im Freisprechmodus, Tablets, smart TVs, Telekonferenzsysteme, Hörgeräte, sprachgesteuerte Systeme etc. benutzen ein oder mehrere Mikrofone, um die gewünschten Sprachsignale aufzunehmen. Wenn sich die Mikrofone nicht in Nähe der gewünschten Schallquelle befinden, können starker akustischer Hall und andere Störgeräusche die Qualität der Mikrofonsignale verringern und die Sprachverständlichkeit sowie die Erkennungsrate von automatischen Spracherkennern stark verschlechtern. Daher ist es eine sehr aktuelle und gefragte Aufgabe, akustischen Hall und Störgeräusche in den Mikrofonsignalen zu reduzieren. Der Prozess, akustischen Nachhall in aufgenommenen Mikrofonsignalen zu reduzieren oder entfernen, wird als Enthallung bezeichnet. Da Enthallung üblicherweise ein blindes Problem ist, wobei die einzig verfügbare Information die Mikrofonsignale sind, und da das akustische Szenario nicht-stationär sein kann, ist Enthallung eine der größten Herausforderungen in der Sprachsignalverarbeitung. Wohingegen in der Theorie perfekte Enthallung mittels inverser Filterung erreicht werden kann, wenn bestimmte Bedingungen erfüllt sind und die Raumimpulsantwort (RIA) bekannt ist, ist die blinde Identifikation der RIA in der Praxis in zeit-varianten und störgeräuschbehafteten akustischen Umgebungen nicht genügend exakt und robust. Daher wurden erfolgreiche Enthallungsmethoden im Zeit-Frequenz Bereich entwickelt, die das Problem oft auf partielle Enthallung aufweichen, wobei hauptsächlich nur der späte Nachhall reduziert wird. Obwohl in den letzten Jahren einige robuste und effiziente Methoden veröffentlicht wurden, die den späten Nachhall zu einem gewissen Grad reduzieren können, ist es immer noch eine große Herausforderung, das enthallte Sprachsignal mit hoher Audioqualität, ohne Verzerrungen und Artefakte mittels Echtzeitverarbeitung mit minimaler Verzögerung zu erhalten. In dieser Dissertation liegt der Fokus auf Enthallungsmethoden für Echtzeitverarbeitung, wie sie in Echtzeit-Telekommunkationssystemen nötig sind. Zur Enthallung können zwei Hauptaspekte ausgenutzt werden: zeitliche und räumliche Information. Erstens erzeugt Hall zeitliche Korrelation und verlängert die Dauer von Phonemen oder akustischen Ereignissen. Diese zeitliche Korrelation kann ausgenutzt werden, um Filter herzuleiten, die das gewünschte Sprachsignal extrahieren oder den Hall reduzieren können. Zweitens kann mit mehreren Mikrofonen räumliche Information ausgenutzt werden, um zwischen dem kohärenten Direktschall und dem räumlich diffusen Nachhall zu unterscheiden. Um die kohärente Schallkomponente zu extrahieren, werden Beamformer oder räumliche Filter benutzt, welche die Mikrofonsignale so filtern und kombinieren, dass nur der Schall aus einer bestimmten Richtung extrahiert wird und der Schall aus anderen Richtungen und diffuser Schall unterdrückt wird. In dieser Dissertation werden mehrere Signalmodelle verwendet, um den akustischen Hall mittels zeitlichen und räumlichen Aspekten zu modellieren. Alle verwendeten Signalmodelle sind im short-time Fourier transform (STFT) Bereich definiert, welcher häufig in der Sprach- und Audio-Signalverarbeitung verwendet wird, und daher eine einfache Integration mit anderen Signalverarbeitungsalgorithmen ermöglicht. Konkret wird ein schmalbandiges endliches Filtermodell, ein schmalbandiges Mehrkanal-autoregressives Modell und ein räumliches Kohärenzmodell verwendet. Für jedes dieser drei Signalmodelle wird eine Methode zur Enthallung und Störgeräuschreduktion entwickelt. Der erste Hauptbeitrag ist ein einkanaliger Schätzer der spektralen Leistungsdichte, eng. power spectral density (PSD), der Signalkomponente des späten Nachhalls, welche benötigt wird um einen spektralen Wiener filter zur Reduktion von Hall und Störgeräuschen zu berechnen. Der vorgeschlagene PSD Schätzer basiert auf einem schmalbandigen endlichen Filtermodell, das relative konvolutive Transferfunktionen verwendet. Im Gegensatz zu anderen einkanaligen PSD Schätzern der Hallkomponente modelliert der entwickelte Schätzer explizit zeit-variante akustische Bedingungen sowie additive Störgeräusche, und benötigt keine Information über die Raumakustik, wie z.~B. die Nachhallzeit oder das Direkt-zu-Nachhall Energieverhältnis, eng. direct-to-reverberation ratio (DRR). Der zweite Hauptbeitrag ist ein mehrkanaliger Hallkomponenten PSD Schätzer basierend auf der räumlichen Kohärenz, wobei der Nachhall als additive diffuse Schallkomponente mit zeit-invarianter räumlicher Kohärenz modelliert wird. In mehrkanaligen Anwendungen kann das gewünschte Signal mit einem Multikanal-Wiener-Filter (MWF) geschätzt werden, welcher die Hallkomponenten PSD benötigt. Zur Verminderung und Maskierung von Sprachverzerrung und Artefakten wird ein generelles Verfahren entwickelt, um den Betrag der Reduktion von Nachhall und Störgeräuschen am Ausgang des MWFs unabhängig kontrollieren zu können. Da eine Vielzahl solcher Hallkomponenten PSD Schätzer in der Literatur existiert, wird ein ausführlicher Überblick, Vergleich und experimenteller Test der Schätzer vom aktuellen Stand der Technik präsentiert. Zusätzlich wird ein Kompensationsverfahren für eine gemeinsame Schwäche aller Hallkomponenten PSD Schätzer in hohen DRRs entwickelt. Der dritte Hauptbeitrag ist eine online Lösung für Enthallung und Störgeräuschreduktion basierend auf einem schmalband Mehrkanal-autoregressiven (MAR) Modell für zeit-variante akustische Umgebungen. Bei diesem Modell wird der späte Nachhall von vorherigen Samples des halligen Sprachsignals mittels der MAR Koeffizienten vorhergesagt und dann vom aktuellen halligen Sprachsignal abgezogen. Eine Neuheit in diesem Verfahren ist eine parallele Struktur, die es ermöglicht, eine kausale Schätzung der zeit-varianten MAR Koeffizienten unter Einfluss von additiven Störgeräuschen zu erhalten. Zusätzlich wird ein Verfahren vorgeschlagen, um den Betrag der Reduktion von Nachhall und Störgeräuschen unabhängig voneinander zu kontrollieren. Im letzen Teil dieser Dissertation werden die drei entwickelten Enthallungssysteme mittels objektiven Maßen, einem Hörversuch und einem automatischen Spracherkennungssystem verglichen. Es wird gezeigt, dass die entwickelten Algorithmen den akustischen Nachhall und Störgeräusche effektiv reduzieren können und direkt in Geräten für Sprachkommunikation implementiert werden können. Die theoretische und experimentelle Evaluierung zeigt die unterschiedlichen Stärken und Grenzen jedes Enthallungsverfahrens auf. Wenn jedes dieser drei Verfahren als repräsentativ für dessen Enthallungs-Gattung gilt, können nützliche Erkenntnisse und Schlüsse für jede Enthallungs-Gattung für bestimmte Anwendungen gezogen werden.
Keyword: Adaptive filters; ddc:620; Noise Reduction
URN: urn:nbn:de:bvb:29-opus4-95837
URL: https://opus4.kobv.de/opus4-fau/files/9583/SebastianBraunDissertation.pdf
https://nbn-resolving.org/urn:nbn:de:bvb:29-opus4-95837
https://opus4.kobv.de/opus4-fau/frontdoor/index/index/docId/9583
BASE
Hide details
5
Multizone Soundfield Reproduction With Privacy- and Quality-Based Speech Masking Filters
In: Faculty of Engineering and Information Sciences - Papers: Part B (2018)
BASE
Show details
6
Robust record linkage blocking using suffix arrays and bloom filters
In: ACM Transactions on Knowledge Discovery from Data (2015)
BASE
Show details
7
Static signature synthesis: A neuromotor inspired approach for biometrics
In: IEEE Transactions on Pattern Analysis and Machine Intelligence[ISSN 0162-8828],v. 37 (6867369), p. 667-680 (2015)
BASE
Show details
8
ВЕРОЯТНОСТНАЯ ИНТЕРПРЕТАЦИЯ РЕФЕРЕНЦИАЛЬНО НЕПРОЗРАЧНОГО ТЕКСТА
СМЕРДОВА ЕКАТЕРИНА АНДРЕЕВНА. - : Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Пермский государственный национальный исследовательский университет», 2014
BASE
Show details
9
Frequency-domain beamformers using conjugate gradient techniques for speech enhancement
Zhao,S; Jones,DL; Khoo,S. - : Acoustical Society of America, 2014
BASE
Show details
10
A Hybrid Approach to Clinical Question Answering
In: DTIC (2014)
BASE
Show details
11
K2U at TREC 2014 KBA Track
In: DTIC (2014)
BASE
Show details
12
Distributed Non-Parametric Representations for Vital Filtering: UW at TREC KBA 2014
In: DTIC (2014)
BASE
Show details
13
Probabilistic Sequence Models with Speech and Language Applications
Henter, Gustav Eje. - : KTH, Kommunikationsteori, 2013. : Stockholm, 2013
BASE
Show details
14
Making Semantic Information Work Effectively for Degraded Environments
In: DTIC (2013)
BASE
Show details
15
Entity Retrieval by Hierarchical Relevance Model, Exploiting the Structure of Tables and Learning Homepage Classifiers
In: DTIC (2009)
BASE
Show details
16
Result Diversity and Entity Ranking Experiments: Anchors, Links, Text and Wikipedia
In: DTIC (2009)
BASE
Show details
17
Formulating Simple Structured Queries using Temporal and Distributional Cues in Patents
In: DTIC (2009)
BASE
Show details
18
Abordagem individualizada do disléxico em equipa interdisciplinar
Almeida, Alexandre Frey Pinto de. - : Edições Universidade Fernando Pessoa, 2009
BASE
Show details
19
Implementation of Appropriate Technology to Treat Drinking Water in Rural Tanzania
In: http://rave.ohiolink.edu/etdc/view?acc_num=ucin1218749376 (2008)
BASE
Show details
20
IIT Kharagpur at TREC 2008 Blog Track
In: DTIC (2008)
BASE
Show details

Page: 1 2 3 4 5 6

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
2
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
104
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern