Clusteranzahlbestimmung und Clusterung unter Nebenbedingungen in der Musiksignalanalyse und in Energienetzen

Loading...
Thumbnail Image

Date

2022

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Clusterverfahren sind ein wichtiges Werkzeug des unüberwachten maschinellen Lernens. Sie ermöglichen eine automatisierte Strukturierung von großen Datenmengen und können so ein wichtiges Werkzeug zur weiteren Datenverarbeitung bzw. -analyse sein oder das Fundament für Entscheidungen bilden. Die in dieser Arbeit betrachteten Anwendungsbeispiele aus der Musiksignalanalyse sowie der Elektrotechnik zeigen, dass reine distanzbasierte Clusterverfahren nicht immer ausreichend sind und Nebenbedingungen in die zugrundeliegenden Optimierungsprobleme eingefügt werden müssen, um sinnvolle Clusterungen zu erhalten, die für den Anwender hilfreich sind. Hierfür werden die Order Constrained Solutions in k-Means Clustering (OCKC) und Spectral Clustering zur Abbildung der Nebenbedingungen verwendet. Für OCKC wird zusätzlich eine effiziente Implementierung des Verfahrens vorgestellt. Ein gemeinsame Herausforderungen aller Clusterverfahren ist die Festlegung der Anzahl der Cluster. Da es sich bei den hier betrachteten Clusterverfahren um Methoden mit Nebenbedingungen handelt, kann klassische Stabilitätsanalyse mit Hilfe des adjustierten Rand-Index auf Bootstrap-Stichproben der Daten nicht für die Beurteilung der Clusterstabilität verwendet werden, da diese unter Umständen die Nebenbedindung verletzt. Es werden Alternativen präsentiert, die sowohl unter Ordnungsrestriktion, als auch bei einer Nachbarschaftsbedingung die Einhaltung der Nebenbedingung in den generierten Datensätzen sicherstellen. Mit diesen Methoden ist auch bei den Clusterverfahren mit Nebenbedingungen eine Beurteilung der Clusterstabilität mit dem Rand-Index möglich.

Description

Table of contents

Keywords

Clusterung, Nebenbedingungen, Klassifikation, Musiksignalanalyse, Energienetze

Citation