Data Mining gegen Data Warehousing
Data Mining und Data Warehousing sind sowohl sehr leistungsstarke als auch beliebte Techniken zur Analyse von Daten. Benutzer, die zu Statistiken geneigt sind, verwenden Data Mining. Sie verwenden statistische Modelle, um nach versteckten Mustern in Daten zu suchen. Data Miner sind daran interessiert, nützliche Beziehungen zwischen verschiedenen Datenelementen zu finden, was für Unternehmen letztendlich profitabel ist. Andererseits tendieren Datenexperten, die die Dimensionen des Geschäfts direkt analysieren können.
Data Mining wird auch als Wissensdeckung in Daten (KDD) bezeichnet. Wie oben erwähnt, handelt es sich um ein Bereich der Informatik, das sich mit der Extraktion bisher unbekannter und interessanter Informationen aus Rohdaten befasst. Aufgrund des exponentiellen Datenwachstums, insbesondere in Bereichen wie Business, ist Data Mining ein sehr wichtiges Instrument geworden. Zum Beispiel wurde es derzeit für verschiedene Anwendungen wie soziale Netzwerkanalyse, Betrugserkennung und Marketing verwendet. Data Mining befasst sich normalerweise mit den folgenden vier Aufgaben: Clustering, Klassifizierung, Regression und Assoziation. Das Clustering identifiziert ähnliche Gruppen aus unstrukturierten Daten. Klassifizierung sind Lernregeln, die auf neue Daten angewendet werden können und in der Regel folgende Schritte enthalten: Vorverarbeitung von Daten, Entwerfen von Modellierung, Lern-/Merkmalsauswahl und Bewertung/Validierung. Die Regression findet Funktionen mit minimalem Fehler, um Daten zu modellieren. Und Assoziation sucht nach Beziehungen zwischen Variablen. Data Mining wird normalerweise verwendet, um Fragen wie die Hauptprodukte zu beantworten, die dazu beitragen könnten, im nächsten Jahr einen hohen Gewinn in Wal-Mart zu erzielen?
Wie oben erwähnt, wird Data Warehousing auch zur Analyse von Daten verwendet, jedoch von verschiedenen Benutzersätzen und einem etwas anderen Ziel im Auge. Wenn es beispielsweise um den Einzelhandelssektor geht, befassen sich Data Warehousing -Benutzer mehr damit, welche Arten von Einkäufen bei den Kunden beliebt sind, sodass die Ergebnisse der Analyse dem Kunden helfen können, die Kundenerfahrung zu verbessern. Aber Data Miners vermutet zuerst eine Hypothese, beispielsweise die Kunden eine bestimmte Art von Produkt kaufen und die Daten analysieren, um die Hypothese zu testen. Data Warehousing könnte von einem großen Einzelhändler durchgeführt werden, der seine Geschäfte zunächst mit den gleichen Produktengrößen stützt, um später herauszufinden, dass New York Stores ein kleineres Inventar viel schneller verkauft als in Chicago -Läden. Durch die Betrachtung dieses Ergebnisses kann der Einzelhändler das New Yorker Geschäft mit kleineren Größen im Vergleich zu Chicago -Geschäften lagern.
Wie Sie also deutlich sehen können, scheinen diese beiden Arten von Analysen die gleiche Natur wie das bloß. Beide sind besorgt darüber, die Gewinne auf der Grundlage der historischen Daten zu steigern. Aber natürlich gibt es wichtige Unterschiede. In einfachen Worten widmen sich Data Mining und Data Warehousing für verschiedene Arten von Analysen, aber definitiv für verschiedene Arten von Benutzern. Mit anderen Worten, Data Mining sucht nach Korrelationen, Patters, um eine statistische Hypothese zu unterstützen. Aber Data Warehousing beantwortet eine vergleichsweise breiter.