Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data

Malyarchuk, Vladislav

Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data

dc.contributor.advisor	Janiesch, Christian
dc.contributor.author	Malyarchuk, Vladislav
dc.contributor.referee	Stahmann, Philip
dc.date.accessioned	2025-07-21T06:01:26Z
dc.date.available	2025-07-21T06:01:26Z
dc.date.issued	2025
dc.description.abstract	In vielen praxisnahen Geschäftsanwendungen sind Daten von Natur aus unausgewogen: Bestimmte Klassen treten wesentlich seltener auf als andere, was konventionelle Machine-Learning-Modelle vor erhebliche Herausforderungen stellt. Diese Modelle zeigen häufig eine schlechtere Leistung bei unterrepräsentierten Klassen, gerade jenen, die für Entscheidungen in kritischen Anwendungsgebieten wie Cybersicherheit, medizinischer Diagnostik, Fehlererkennung und anderen besonders entscheidend sein können. Diese Arbeit befasst sich mit dem Problem der Multiklassenklassifikation auf unausgewogenen strukturierten Datensätzen, indem eine allgemeine neuronale Netzwerkarchitektur entwickelt wird, die ohne domänenspezifische Anpassung in unterschiedlichsten Anwendungsfällen einsetzbar ist. Die vorgeschlagene Architektur wird mit anderen gängigen, modernen Ansätzen verglichen und anhand von vier öffentlich verfügbaren Datensätzen (KDD-99, Darknet, Shuttle und Covertype) evaluiert, die jeweils eine einzigartige Kombination aus Dimensionalität, Umfang und Grad der Unausgewogenheit darstellen. Die Ergebnisse zeigen, dass bestimmte architektonische Entscheidungen (darunter auch die in dieser Arbeit eingeführten "Random Mixing Layers") eine starke Leistung auf strukturierten unausgewogenen Datensätzen ermöglichen, während gleichzeitig die Recheneffizienz auf gängiger Verbraucher-Hardware gewahrt bleibt. Die endgültige Architektur (einschließlich der Zwischenschritte und der verwendeten Datensätze) wird als Open Source veröffentlicht, um die Reproduzierbarkeit und Anwendung in akademischen, industriellen und öffentlichen Domänen zu unterstützen.	de
dc.description.abstract	In many real-world business cases, data is inherently imbalanced: certain classes occur far less frequently than others, posing significant challenges to conventional machine learning models. These models often underperform on minority classes, which can be the most critical for decision-making in domains such as cybersecurity, medical diagnostics, fault detection, and others. This thesis addresses the problem of multi-class classification on imbalanced structured datasets by developing a general-purpose neural network architecture that can be applied across diverse use-cases without domain-specific tuning. The proposed architecture is also compared to other commonly used contemporary approaches and benchmarked on four publicly available datasets (KDD-99, Darknet, Shuttle, and Covertype), each representing a unique combination of dimensionality, size, and imbalance severity. The results demonstrate that specific architectural choices, including Random Mixing Layers introduced in this work, can yield strong performance across structured imbalanced datasets while maintaining computational efficiency on common consumergrade hardware. The final architecture (including the intermediary steps and the used datasets) is released as open-source to support reproducibility and application across academic, industrial, and public domains.	en
dc.identifier.uri	http://hdl.handle.net/2003/43813
dc.identifier.uri	http://dx.doi.org/10.17877/DE290R-25587
dc.language.iso	en
dc.subject.ddc	004
dc.title	Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data	en
dc.type	Text
dc.type.publicationtype	MasterThesis
dcterms.accessRights	open access
eldorado.secondarypublication	false

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Masterarbeit_Malyarchuk.pdf
Size:: 2.42 MB
Format:: Adobe Portable Document Format
Description:: DNB

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 4.04 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Weltweit zugängliche Prüfungsarbeiten