Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data

dc.contributor.advisorJaniesch, Christian
dc.contributor.authorMalyarchuk, Vladislav
dc.contributor.refereeStahmann, Philip
dc.date.accessioned2025-07-21T06:01:26Z
dc.date.available2025-07-21T06:01:26Z
dc.date.issued2025
dc.description.abstractIn vielen praxisnahen Geschäftsanwendungen sind Daten von Natur aus unausgewogen: Bestimmte Klassen treten wesentlich seltener auf als andere, was konventionelle Machine-Learning-Modelle vor erhebliche Herausforderungen stellt. Diese Modelle zeigen häufig eine schlechtere Leistung bei unterrepräsentierten Klassen, gerade jenen, die für Entscheidungen in kritischen Anwendungsgebieten wie Cybersicherheit, medizinischer Diagnostik, Fehlererkennung und anderen besonders entscheidend sein können. Diese Arbeit befasst sich mit dem Problem der Multiklassenklassifikation auf unausgewogenen strukturierten Datensätzen, indem eine allgemeine neuronale Netzwerkarchitektur entwickelt wird, die ohne domänenspezifische Anpassung in unterschiedlichsten Anwendungsfällen einsetzbar ist. Die vorgeschlagene Architektur wird mit anderen gängigen, modernen Ansätzen verglichen und anhand von vier öffentlich verfügbaren Datensätzen (KDD-99, Darknet, Shuttle und Covertype) evaluiert, die jeweils eine einzigartige Kombination aus Dimensionalität, Umfang und Grad der Unausgewogenheit darstellen. Die Ergebnisse zeigen, dass bestimmte architektonische Entscheidungen (darunter auch die in dieser Arbeit eingeführten "Random Mixing Layers") eine starke Leistung auf strukturierten unausgewogenen Datensätzen ermöglichen, während gleichzeitig die Recheneffizienz auf gängiger Verbraucher-Hardware gewahrt bleibt. Die endgültige Architektur (einschließlich der Zwischenschritte und der verwendeten Datensätze) wird als Open Source veröffentlicht, um die Reproduzierbarkeit und Anwendung in akademischen, industriellen und öffentlichen Domänen zu unterstützen.de
dc.description.abstractIn many real-world business cases, data is inherently imbalanced: certain classes occur far less frequently than others, posing significant challenges to conventional machine learning models. These models often underperform on minority classes, which can be the most critical for decision-making in domains such as cybersecurity, medical diagnostics, fault detection, and others. This thesis addresses the problem of multi-class classification on imbalanced structured datasets by developing a general-purpose neural network architecture that can be applied across diverse use-cases without domain-specific tuning. The proposed architecture is also compared to other commonly used contemporary approaches and benchmarked on four publicly available datasets (KDD-99, Darknet, Shuttle, and Covertype), each representing a unique combination of dimensionality, size, and imbalance severity. The results demonstrate that specific architectural choices, including Random Mixing Layers introduced in this work, can yield strong performance across structured imbalanced datasets while maintaining computational efficiency on common consumergrade hardware. The final architecture (including the intermediary steps and the used datasets) is released as open-source to support reproducibility and application across academic, industrial, and public domains.en
dc.identifier.urihttp://hdl.handle.net/2003/43813
dc.identifier.urihttp://dx.doi.org/10.17877/DE290R-25587
dc.language.isoen
dc.subject.ddc004
dc.titleDeveloping a general neural network architecture for solving multi-class classification problems in imbalanced multivariate dataen
dc.typeText
dc.type.publicationtypeMasterThesis
dcterms.accessRightsopen access
eldorado.secondarypublicationfalse

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Masterarbeit_Malyarchuk.pdf
Size:
2.42 MB
Format:
Adobe Portable Document Format
Description:
DNB
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.04 KB
Format:
Item-specific license agreed upon to submission
Description: