4  Das CRISP-DM-Modell

Das CRISP-DM-Modell (Cross Industry Standard Process for Data Mining) ist ein bewährter, branchenübergreifender Standardprozess für Data-Mining- und Analytics-Projekte. Es dient als strukturierter Leitfaden, um Daten systematisch zu nutzen – von der ersten Idee bis hin zur praktischen Umsetzung. Durch seine klare Gliederung in sechs Phasen unterstützt es sowohl Einsteiger als auch erfahrene Data Scientists dabei, Projekte effizient und nachvollziehbar zu gestalten.

4.1 Die sechs Phasen von CRISP-DM

  • Business Understanding

    Klärung der Projektziele und Anforderungen aus fachlicher Sicht, bevor mit der Datenarbeit begonnen wird.

  • Data Understanding

    Sammlung, erste Analyse und Bewertung der verfügbaren Daten, um ein Gefühl für Qualität, Vollständigkeit und mögliche Herausforderungen zu bekommen.

  • Data Preparation

    Aufbereitung und Bereinigung der Daten (z. B. Auswahl, Transformation, Integration), damit diese für Modellierungsschritte nutzbar sind.

  • Modeling

    Anwendung statistischer Verfahren und Machine-Learning-Algorithmen, um Muster zu erkennen und Vorhersagen zu ermöglichen.

  • Evaluation

    Überprüfung, ob die Modelle die definierten Geschäftsziele erfüllen und zuverlässig Ergebnisse liefern.

  • Deployment

    Umsetzung der gewonnenen Erkenntnisse in die Praxis, z. B. durch Integration in Geschäftsprozesse oder Bereitstellung eines Systems.