4 Das CRISP-DM-Modell
Das CRISP-DM-Modell (Cross Industry Standard Process for Data Mining) ist ein bewährter, branchenübergreifender Standardprozess für Data-Mining- und Analytics-Projekte. Es dient als strukturierter Leitfaden, um Daten systematisch zu nutzen – von der ersten Idee bis hin zur praktischen Umsetzung. Durch seine klare Gliederung in sechs Phasen unterstützt es sowohl Einsteiger als auch erfahrene Data Scientists dabei, Projekte effizient und nachvollziehbar zu gestalten.
4.1 Die sechs Phasen von CRISP-DM
Business Understanding
Klärung der Projektziele und Anforderungen aus fachlicher Sicht, bevor mit der Datenarbeit begonnen wird.
Data Understanding
Sammlung, erste Analyse und Bewertung der verfügbaren Daten, um ein Gefühl für Qualität, Vollständigkeit und mögliche Herausforderungen zu bekommen.
Data Preparation
Aufbereitung und Bereinigung der Daten (z. B. Auswahl, Transformation, Integration), damit diese für Modellierungsschritte nutzbar sind.
Modeling
Anwendung statistischer Verfahren und Machine-Learning-Algorithmen, um Muster zu erkennen und Vorhersagen zu ermöglichen.
Evaluation
Überprüfung, ob die Modelle die definierten Geschäftsziele erfüllen und zuverlässig Ergebnisse liefern.
Deployment
Umsetzung der gewonnenen Erkenntnisse in die Praxis, z. B. durch Integration in Geschäftsprozesse oder Bereitstellung eines Systems.