Data Mining gegen OLAP
Sowohl Data Mining als auch OLAP sind zwei der Common Business Intelligence (BI) -Technologien. Business Intelligence bezieht sich auf computergestützte Methoden zum Identifizieren und Extrahieren nützlicher Informationen aus Geschäftsdaten. Data Mining ist das Gebiet der Informatik, das sich mit dem Extrahieren interessanter Muster aus großen Datensätzen befasst. Es kombiniert viele Methoden aus künstlicher Intelligenz, Statistik und Datenbankverwaltung. OLAP (Online-Analytische Verarbeitung), wie der Name vermuten lässt.
Data Mining wird auch als Wissensdeckung in Daten (KDD) bezeichnet. Wie oben erwähnt, handelt es sich um ein Bereich der Informatik, das sich mit der Extraktion bisher unbekannter und interessanter Informationen aus Rohdaten befasst. Aufgrund des exponentiellen Datenwachstums, insbesondere in Bereichen wie Business, ist Data Mining ein sehr wichtiges Instrument geworden. Zum Beispiel wurde es derzeit für verschiedene Anwendungen wie soziale Netzwerkanalyse, Betrugserkennung und Marketing verwendet. Data Mining befasst sich normalerweise mit den folgenden vier Aufgaben: Clustering, Klassifizierung, Regression und Assoziation. Das Clustering identifiziert ähnliche Gruppen aus unstrukturierten Daten. Klassifizierung sind Lernregeln, die auf neue Daten angewendet werden können und in der Regel folgende Schritte enthalten: Vorverarbeitung von Daten, Entwerfen von Modellierung, Lern-/Merkmalsauswahl und Bewertung/Validierung. Die Regression findet Funktionen mit minimalem Fehler, um Daten zu modellieren. Und Assoziation sucht nach Beziehungen zwischen Variablen. Data Mining wird normalerweise verwendet, um Fragen wie die Hauptprodukte zu beantworten, die dazu beitragen könnten, im nächsten Jahr einen hohen Gewinn in Wal-Mart zu erzielen.
OLAP ist eine Klasse von Systemen, die Antworten auf mehrdimensionale Anfragen liefert. In der Regel wird OLAP für Marketing, Budgetierung, Prognose und ähnliche Anwendungen verwendet. Es versteht sich von selbst, dass die für OLAP verwendeten Datenbanken für komplexe und Ad-hoc-Abfragen mit einer schnellen Leistung konfiguriert sind. Typischerweise wird eine Matrix verwendet, um die Ausgabe einer OLAP anzuzeigen. Die Zeilen und Spalten werden durch die Abmessungen der Abfrage gebildet. Sie verwenden häufig Methoden der Aggregation in mehreren Tabellen, um Zusammenfassungen zu erhalten. Zum Beispiel kann es verwendet werden, um den Umsatz dieses Jahres in Wal-Mart im Vergleich zum Vorjahr zu erfahren? Was ist die Vorhersage des Umsatzes im nächsten Quartal?? Was kann über den Trend gesagt werden, indem Sie sich die prozentuale Veränderung ansehen?
Obwohl es offensichtlich ist, dass Data Mining und OLAP ähnlich sind, da sie Daten zur Intelligenz haben, liegt der Hauptunterschied von der Art und Weise, wie sie auf Daten arbeiten. OLAP -Tools bieten eine mehrdimensionale Datenanalyse und sie bieten Zusammenfassungen der Daten, aber im Gegensatz dazu konzentriert sich das Data Mining auf Verhältnisse, Muster und Einflüsse im Datensatz. Dies ist ein OLAP -Vertrag mit Aggregation, das auf den Betrieb von Daten über „Addition“ hinausgeht, aber Data Mining entspricht der „Teilung“. Andere bemerkenswerte Unterschiede besteht darin, dass die Modelldaten für Data Mining -Tools und die Rückgabe umsetzbarer Regeln jedoch Vergleichs- und Kontrastechniken entlang der Geschäftsdimension in Echtzeit durchführen.