Der Schlüsselunterschied Zwischen Klassifizierung und Regressionsbaum ist das In der Klassifizierung sind die abhängigen Variablen kategorisch und ungeordnet, während in der Regression die abhängigen Variablen kontinuierlich oder geordnete ganze Werte sind.
Klassifizierung und Regression sind Lerntechniken, um Vorhersagemodelle aus gesammelten Daten zu erstellen. Beide Techniken werden grafisch als Klassifizierungs- und Regressionsbäume oder eher Flussdiagramme mit Datenabteilungen nach jedem Schritt oder eher „Zweig“ im Baum dargestellt. Dieser Prozess wird als rekursive Partitionierung bezeichnet. Felder wie das Mining verwenden diese Klassifizierungs- und Regressionslernentechniken. Dieser Artikel konzentriert sich auf den Klassifizierungsbaum und den Regressionsbaum.
1. Überblick und wichtiger Unterschied
2. Was ist Klassifizierung
3. Was ist Regression
4. Seite für Seitenvergleich - Klassifizierung gegen Regression in tabellarischer Form
5. Zusammenfassung
Die Klassifizierung ist eine Technik, die zu einem Schema verwendet wird, das die Organisation von Daten zeigt, die mit einer Vorläufervariablen beginnen. Die abhängigen Variablen klassifizieren die Daten.
Abbildung 01: Data Mining
Der Klassifizierungsbaum beginnt mit der unabhängigen Variablen, die sich in zwei Gruppen verzweigt, wie durch die vorhandenen abhängigen Variablen bestimmt werden. Es soll die Antworten in Form der Kategorisierung aufklären, die durch die abhängigen Variablen verursacht werden.
Die Regression ist eine Vorhersagemethode, die auf einem angenommenen oder bekannten numerischen Ausgangswert basiert. Dieser Ausgangswert ist das Ergebnis einer Reihe rekursiver Partitionierung, wobei jeder Schritt einen numerischen Wert und eine andere Gruppe abhängiger Variablen mit einem anderen Paar wie diesem aufweist.
Der Regressionsbaum beginnt mit einer oder mehreren Vorläufervariablen und endet mit einer endgültigen Ausgangsvariablen. Die abhängigen Variablen sind entweder kontinuierliche oder diskrete numerische Variablen.
Klassifizierung gegen Regression | |
Ein Baummodell, bei dem die Zielvariable einen diskreten Satz von Werten annehmen kann. | Ein Baummodell, bei dem die Zielvariable kontinuierliche Werte in der Regel reelle Zahlen annehmen kann. |
Abhängige Variable | |
Für die Klassifizierungsbaum sind die abhängigen Variablen kategorisch. | Für Regressionsbaum sind die abhängigen Variablen numerisch. |
Werte | |
Hat eine festgelegte Menge an ungeordneten Werten. | Hat entweder diskrete, aber geordnete Werte oder indiskrete Werte. |
Konstruktionszweck | |
Der Zweck der Konstruktion des Regressionsbaum. | Ein Klassifizierungsbaum verzweigt sich, wie durch eine abhängige Variable bestimmt, die vom vorherigen Knoten abgeleitet wurde. |
Regressions- und Klassifizierungsbäume sind hilfreiche Techniken, um den Prozess zu ermitteln, der auf ein untersuchtes Ergebnis hinweist, sei es in der Klassifizierung oder in einem einzigen numerischen Wert. Der Unterschied zwischen dem Klassifizierungsbaum und dem Regressionsbaum ist ihre abhängige Variable. Klassifizierungsbäume haben abhängige Variablen, die kategorisch und ungeordnet sind. Regressionsbäume haben abhängige Variablen, die kontinuierliche Werte oder geordnete ganze Werte sind.
1.„Entscheidungsbaumlernen.” Wikipedia, Wikimedia Foundation, 13. Mai 2018. Hier verfügbar
1.'Data Mining'By Arbeck - eigene Arbeit (CC von 3.0) über Commons Wikimedia