Lineare vs logistische Regression
In der statistischen Analyse ist es wichtig, die Beziehungen zwischen den betreffenden Variablen zur Studie zu identifizieren. Manchmal kann es der einzige Zweck der Analyse selbst sein. Ein starkes Instrument, das verwendet wird, um die Existenz von Beziehung zu bestimmen und die Beziehung zu identifizieren, ist die Regressionsanalyse.
Die einfachste Form der Regressionsanalyse ist die lineare Regression, bei der die Beziehung zwischen den Variablen eine lineare Beziehung ist. In statistischer Hinsicht bringt es die Beziehung zwischen der erklärenden Variablen und der Antwortvariablen hervor. Zum Beispiel können wir mit Regression die Beziehung zwischen dem Rohstoffpreis und dem Verbrauch basierend auf Daten herstellen, die aus einer Zufallsstichprobe gesammelt wurden. Die Regressionsanalyse erzeugt eine Regressionsfunktion des Datensatzes, bei der es sich um ein mathematisches Modell handelt, das am besten zu den verfügbaren Daten passt. Dies kann leicht durch ein Streudiagramm dargestellt werden. Grafische Regression entspricht der Suche nach der besten Anpassungskurve für den angegebenen Datensatz. Die Funktion der Kurve ist die Regressionsfunktion. Mit dem mathematischen Modell kann die Verwendung einer Ware für einen bestimmten Preis vorhergesagt werden.
Daher wird die Regressionsanalyse häufig zur Vorhersage und Prognose verwendet. Es wird auch verwendet, um die Beziehungen zu experimentellen Daten, in den Bereichen Physik, Chemie und in vielen natürlichen Wissenschaften und technischen Disziplinen festzustellen. Wenn die Beziehung oder die Regressionsfunktion eine lineare Funktion ist, wird der Prozess als lineare Regression bezeichnet. Im Streudiagramm kann es als gerade Linie dargestellt werden. Wenn die Funktion keine lineare Kombination der Parameter ist, ist die Regression nicht linear.
Die logistische Regression ist vergleichbar mit der multivariaten Regression und erstellt ein Modell, um die Auswirkungen mehrerer Prädiktoren auf eine Antwortvariable zu erklären. In der logistischen Regression sollte die Endergebnisvariable jedoch kategorisch sein (normalerweise geteilt; i i;.e., Ein Paar erreichbare Ergebnisse wie Tod oder Überleben, obwohl spezielle Techniken es ermöglichen, kategorisiertere Informationen zu modellieren). Eine kontinuierliche Ergebnisvariable kann in eine kategoriale Variable umgewandelt werden, die für die logistische Regression verwendet werden kann. Das Zusammenbrechen kontinuierlicher Variablen auf diese Weise ist jedoch größtenteils entmutigt, da dies die Genauigkeit verringert.
Anders als in der linearen Regression müssen die Prädiktorvariablen in der logistischen Regression nicht gezwungen werden, linear verbunden, häufig verteilt oder in jedem Cluster gleiche Varianz zu haben. Infolgedessen ist die Beziehung zwischen Prädiktor und Ergebnisvariablen wahrscheinlich keine lineare Funktion.
Was ist der Unterschied zwischen logistischer und linearer Regression?
• Bei der linearen Regression wird eine lineare Beziehung zwischen der erklärenden Variablen und der Antwortvariablen angenommen, und die Parameter, die das Modell erfüllen.
• Lineare Regression wird für quantitative Variablen durchgeführt, und die resultierende Funktion ist quantitativ.
• In der logistischen Regression können die verwendeten Daten entweder kategorisch oder quantitativ sein, aber das Ergebnis ist immer kategorisch.