Optimierung der Toneinsatzzeiterkennung

Bauer, Nadja2016-02-102016-02-102016http://hdl.handle.net/2003/3450410.17877/DE290R-16557Die beiliegende Arbeit befasst sich mit der Optimierung der Toneinsatzzeiterkennung. Die Einsatzzeiterkennung ist eine wichtige Komponente für verschiedene Anwendungen wie Musiktranskription oder Wiedergabe der Musik in Hörgeräten. Angesichts der Komplexität der bekannten Algorithmen zur Einsatzzeiterkennung stellt sich ihre Optimierung als ein nicht triviales Problem dar. Als Hauptergebnisse dieser Arbeit lassen sich die Entwicklung einer neuen schnellen Optimierungsstrategie sowie eines innovativen multivariaten Ansatzes für die Einsatzzeiterkennung nennen. Die Grundidee der verwendeten klassischen modellbasierten Optimierungsmethode (MBO) besteht in der Modellierung des Zusammenhanges zwischen den Einflussparametern und der Zielgröße durch ein so genanntes Surrogatmodell. Die Versuche (bzw. Experimente) werden dann iterativ durchgeführt, wobei ein neuer Punkt sowohl einen möglichst guten Wert der Surrogatmodell-Vorhersage haben als auch möglichst weit von den bereits evaluierten Punkten entfernt liegen soll. Die vorgeschlagene Methode der instanzgebundenen modellbasierten Optimierung eignet sich für solche Probleme, bei denen die Zielfunktion in jeder Iteration auf mehreren Instanzen ausgewertet werden soll. Hier stellen die Musikstücke die Probleminstanzen dar. Die Hauptidee liegt dabei in einer modellbasierten Entscheidung, ob die Instanzauswertung in jeder Verfahrensiteration wegen einer nicht aussichtsreichen Güte frühzeitig abgebrochen werden soll. Im Mittel konnte dadurch ca. 85% der Funktionsauswertungszeit im Vergleich zu klassischer MBO gespart werden bei einem geringen Güteverlust. Das wesentliche Ergebnis in Bezug auf das Anwendungsproblem ist die Entwicklung der multivariaten Einsatzzeiterkennung: einer Methode, bei der nicht nur ein, sondern mehrere Merkmale bei der Schätzung der Toneinsatzzeiten berücksichtigt werden. Realisiert wird sie durch die Anwendung von Klassifikationsverfahren. Besonders erfolgreich scheint der Zufallswald für diese Aufgabe zu sein: die Erkennungsgüte konnte deutlich und auch statistisch signifikant im Vergleich zu herkömmlichen univariaten Algorithmen verbessert werden. Außerdem bieten die optimalen Einstellungen des multivariaten Verfahrens die Möglichkeit, die Latenzzeit der online Erkennung deutlich zu reduzieren. Anschließend wurde eine innovative Idee für eine weitere Verbesserungsmöglichkeit der Einsatzzeiterkennung diskutiert: Berücksichtigung der (größtenteils) strikten zeitlichen Struktur einer Musikaufnahme. Nachdem diese Struktur erkannt wird, könnten beispielsweise die geschätzten Toneinsätze präziser gesetzt bzw. verworfen werden.deModellbasierte OptimierungSignalanalyseToneinsatzErkennung der Toneinsätze310Optimierung der Toneinsatzzeiterkennungdoctoral thesis