Deskriptive gegen Inferenzstatistiken
Statistiken sind die Disziplin der Erfassung, Analyse und Präsentation von Daten. Die Theorie der Statistik wird aufgrund der Informationen, die sie erstellen, in zwei Zweige unterteilt, indem sie die Daten analysieren.
Was ist beschreibende Statistiken?
Beschreibende Statistik ist der Zweig der Statistiken, die die Haupteigenschaften eines Datensatzes quantitativ beschreiben. Um die Eigenschaften eines Datensatzes so genau wie möglich darzustellen, werden die Daten entweder mit grafischen oder numerischen Tools zusammengefasst.
Die grafische Zusammenfassung erfolgt durch Tabellierung, Gruppierung und Grafik der Werte der interessierenden Variablen. Histogramme der Frequenzverteilung und der relativen Frequenzverteilung sind solche Darstellungen. Sie zeigen die Verteilung der Werte in der Bevölkerung.
Die numerische Zusammenfassung beinhaltet die Berechnung deskriptiver Maßnahmen wie Durchschnitt, Modus und Mittelwert. Die beschreibenden Maßnahmen werden weiter in zwei Klassen eingeteilt. Sie sind Maßnahmen zur zentralen Tendenz und Messungen der Dispersion/Variation. Die Messungen der zentralen Tendenz sind der Mittelwert/Durchschnitt, Median und Modus. Jeder hat seinen eigenen Niveau an Anwendbarkeit und Nützlichkeit. Wenn einer scheitern kann, kann der andere den Datensatz besser darstellen.
Wie der Name schon sagt, umfassen Messungen der Dispersion die Messung der Verteilung der Daten. Der Bereich, Standardabweichung, Varianz, Perzentile und Quartilbereiche sowie Variationskoeffizienten sind Dispersionsmaßnahmen. Sie liefern Informationen über die Verbreitung der Daten.
Ein einfaches Beispiel für die Verwendung beschreibender Statistiken ist die Berechnung des Notendurchschnitts eines Schülers. Die GPA ist im Wesentlichen der gewichtete Mittelwert der Ergebnisse der Schüler und spiegelt die allgemeine akademische Leistung dieses bestimmten Schülers wider.
Was ist Inferenzstatistik?
Inferenzstatistik ist der Zweig der Statistik, der Schlussfolgerungen über die betroffene Bevölkerung aus dem Datensatz ableitet. Im Allgemeinen stammen die Ergebnisse aus einer Zufallsstichprobe der Bevölkerung und die aus der Stichprobe abgeleiteten Schlussfolgerungen werden dann verallgemeinert, um die gesamte Bevölkerung darzustellen.
Die Stichprobe ist eine Untergruppe der Bevölkerung, und Maßnahmen der deskriptiven Statistiken für die aus der Stichprobe erfassten Daten sind einfach als bezeichnet als Statistiken. Die aus der Analyse der Stichprobe erhaltenen messen beschreibenden Statistiken werden als Parameter bezeichnet, wenn sie auf die Bevölkerung angewendet werden, und repräsentieren die gesamte Bevölkerung.
Inferenzstatistiken konzentrieren sich darauf, wie die Statistiken aus einer Stichprobe so genau wie möglich verallgemeinert werden können, um die Bevölkerung darzustellen. Ein Anliegen der Sorge ist die Art der Stichprobe. Wenn die Stichprobe verzerrt ist, sind die Ergebnisse ebenfalls verzerrt, und die auf diesen basierenden Parameter repräsentieren nicht die gesamte Bevölkerung korrekt. Probenahme ist daher eine wichtige Studie der Inferenzstatistiken. Statistische Annahmen, statistische Entscheidungstheorie und Schätztheorie, Hypothesentests, Entwurf von Experimenten, Varianzanalyse und Regressionsanalyse sind herausragende Themen der Studie in der Theorie der Inferenzstatistik.
Ein gutes Beispiel für Inferenzstatistiken in Aktion ist die Vorhersage der Ergebnisse einer Wahl vor der Abstimmung mittels Wahlen.
Was ist der Unterschied zwischen deskriptiven und inferentiellen Statistiken?
• Deskriptive Statistiken konzentrieren sich auf die Zusammenfassung der von einer Stichprobe gesammelten Daten. Die Technik erzeugt Messungen der zentralen Tendenz und Dispersion, die darstellen, wie die Werte der Variablen konzentriert und verteilt sind.
• Inferenzstatistiken verallgemeinern die Statistiken, die aus einer Stichprobe erhalten wurden, auf die allgemeine Bevölkerung, zu der die Stichprobe gehört. Die Bevölkerungsmaßnahmen werden als Parameter bezeichnet.
• Deskriptive Statistiken machen nur die Eigenschaften der Stichprobe, aus der Daten erfasst wurden.
• In der Inferenzstatistik wurden die Parameter aus einer Stichprobe erhalten, nicht jedoch die gesamte Bevölkerung; Daher gibt es immer eine gewisse Unsicherheit im Vergleich zu den tatsächlichen Werten.