Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data
dc.contributor.advisor | Janiesch, Christian | |
dc.contributor.author | Malyarchuk, Vladislav | |
dc.contributor.referee | Stahmann, Philip | |
dc.date.accessioned | 2025-07-21T06:01:26Z | |
dc.date.available | 2025-07-21T06:01:26Z | |
dc.date.issued | 2025 | |
dc.description.abstract | In vielen praxisnahen Geschäftsanwendungen sind Daten von Natur aus unausgewogen: Bestimmte Klassen treten wesentlich seltener auf als andere, was konventionelle Machine-Learning-Modelle vor erhebliche Herausforderungen stellt. Diese Modelle zeigen häufig eine schlechtere Leistung bei unterrepräsentierten Klassen, gerade jenen, die für Entscheidungen in kritischen Anwendungsgebieten wie Cybersicherheit, medizinischer Diagnostik, Fehlererkennung und anderen besonders entscheidend sein können. Diese Arbeit befasst sich mit dem Problem der Multiklassenklassifikation auf unausgewogenen strukturierten Datensätzen, indem eine allgemeine neuronale Netzwerkarchitektur entwickelt wird, die ohne domänenspezifische Anpassung in unterschiedlichsten Anwendungsfällen einsetzbar ist. Die vorgeschlagene Architektur wird mit anderen gängigen, modernen Ansätzen verglichen und anhand von vier öffentlich verfügbaren Datensätzen (KDD-99, Darknet, Shuttle und Covertype) evaluiert, die jeweils eine einzigartige Kombination aus Dimensionalität, Umfang und Grad der Unausgewogenheit darstellen. Die Ergebnisse zeigen, dass bestimmte architektonische Entscheidungen (darunter auch die in dieser Arbeit eingeführten "Random Mixing Layers") eine starke Leistung auf strukturierten unausgewogenen Datensätzen ermöglichen, während gleichzeitig die Recheneffizienz auf gängiger Verbraucher-Hardware gewahrt bleibt. Die endgültige Architektur (einschließlich der Zwischenschritte und der verwendeten Datensätze) wird als Open Source veröffentlicht, um die Reproduzierbarkeit und Anwendung in akademischen, industriellen und öffentlichen Domänen zu unterstützen. | de |
dc.description.abstract | In many real-world business cases, data is inherently imbalanced: certain classes occur far less frequently than others, posing significant challenges to conventional machine learning models. These models often underperform on minority classes, which can be the most critical for decision-making in domains such as cybersecurity, medical diagnostics, fault detection, and others. This thesis addresses the problem of multi-class classification on imbalanced structured datasets by developing a general-purpose neural network architecture that can be applied across diverse use-cases without domain-specific tuning. The proposed architecture is also compared to other commonly used contemporary approaches and benchmarked on four publicly available datasets (KDD-99, Darknet, Shuttle, and Covertype), each representing a unique combination of dimensionality, size, and imbalance severity. The results demonstrate that specific architectural choices, including Random Mixing Layers introduced in this work, can yield strong performance across structured imbalanced datasets while maintaining computational efficiency on common consumergrade hardware. The final architecture (including the intermediary steps and the used datasets) is released as open-source to support reproducibility and application across academic, industrial, and public domains. | en |
dc.identifier.uri | http://hdl.handle.net/2003/43813 | |
dc.identifier.uri | http://dx.doi.org/10.17877/DE290R-25587 | |
dc.language.iso | en | |
dc.subject.ddc | 004 | |
dc.title | Developing a general neural network architecture for solving multi-class classification problems in imbalanced multivariate data | en |
dc.type | Text | |
dc.type.publicationtype | MasterThesis | |
dcterms.accessRights | open access | |
eldorado.secondarypublication | false |