Knowledge discovery in databases at a conceptual level
Loading...
Date
2008-01-15T10:14:14Z
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Wissensentdeckung in Datenbanken (engl. Knowledge Discovery in
Databases, KDD) ist die Bezeichnung für einen nichttrivialen
Prozess, der im Kern eine oder mehrere Anwendungen eines
Algorithmus aus dem Maschinellen Lernen auf echte Daten beinhaltet.
Vorbereitende Schritte in diesem Prozess bereiten die Beispiele,
aus denen gelernt wird, auf, erstellen also die Beispiel-
Repräsentationssprache. Nachfolgende Schritte wenden die gelernten
Ergebnisse auf neue Daten an. In dieser Arbeit wird der gesamte
Prozess auf einer konzeptuellen (begrifflichen) Ebene analysiert.
Außerdem wird MiningMart beschrieben, eine Software, die den
gesamten Prozess unterstützt, aber den Fokus auf die Vorverarbeitung
der Daten legt. Diese Vorverarbeitungsphase ist die zeitintensivste
Phase des Wissensentdeckungsprozesses. Sie wird durch die Beiträge
dieser Arbeit umfassend und auf neuartige Weise unterstützt. Im
Ergebnis lässt sich der Aufwand für Benutzer bei der Erstellung,
beim Rapid Prototyping, bei der Modellierung, Ausführung,
Veröffentlichung und Wiederverwendung von KDD-Prozessen deutlich
reduzieren.
Knowledge Discovery in Databases (KDD) is a nontrivial process centered around one or more applications of a Machine Learning algorithm to real world data. Steps leading towards this central step prepare the examples from which the algorithm learns, and thus create the example representation language. Steps following the central step may deploy the learned results to new data. In this thesis, the complete process is described from a conceptual view, and the MiningMart software is presented which supports the whole process, but puts its focus on data preparation for KDD. This preparation phase is the most time-consuming part of the process, and is comprehensively supported in new ways by the contributions towards MiningMart made in this thesis. The result are greatly reduced user efforts for rapid prototyping, modelling, execution, publication and re-use of KDD processes.
Knowledge Discovery in Databases (KDD) is a nontrivial process centered around one or more applications of a Machine Learning algorithm to real world data. Steps leading towards this central step prepare the examples from which the algorithm learns, and thus create the example representation language. Steps following the central step may deploy the learned results to new data. In this thesis, the complete process is described from a conceptual view, and the MiningMart software is presented which supports the whole process, but puts its focus on data preparation for KDD. This preparation phase is the most time-consuming part of the process, and is comprehensively supported in new ways by the contributions towards MiningMart made in this thesis. The result are greatly reduced user efforts for rapid prototyping, modelling, execution, publication and re-use of KDD processes.
Description
Table of contents
Keywords
Knowledge discovery in databases, Data preparation, Data mining, Wissensentdeckung, Datenvorverarbeitung