Varianz gegen Kovarianz
Varianz und Kovarianz sind zwei in Statistiken verwendete Maßnahmen. Die Varianz ist ein Maß für die Streuung der Daten, und die Kovarianz zeigt den Grad der Änderung von zwei zufälligen Variablen zusammen an. Varianz ist eher ein intuitives Konzept, aber die Kovarianz wird zunächst mathematisch definiert.
Mehr über Varianz
Die Varianz ist ein Maß für die Dispersion der Daten aus dem Mittelwert der Verteilung. Es zeigt, wie weit die Datenpunkte aus dem Mittelwert der Verteilung liegen. Es ist einer der primären Deskriptoren der Wahrscheinlichkeitsverteilung und einer der Momente der Verteilung. Die Varianz ist auch ein Parameter der Bevölkerung, und die Varianz einer Stichprobe aus der Population fungiert als Schätzer für die Varianz der Population. Aus einer Perspektive ist es als das Quadrat der Standardabweichung definiert.
In der einfachen Sprache kann es als Durchschnitt der Quadrate des Abstands zwischen den einzelnen Datenpunkten und dem Mittelwert der Verteilung beschrieben werden. Die folgende Formel wird verwendet, um die Varianz zu berechnen.
Var (x) = e [(x-µ)2 ] für eine Bevölkerung und
Var (x) = e [(x-‾x)2 ] für eine Probe
Es kann weiter vereinfacht werden, um var (x) = e [x zu ergeben2 ]-(EX])2.
Die Varianz hat einige Signatureigenschaften und wird häufig in Statistiken verwendet, um die Verwendung zu vereinfachen. Die Varianz ist nicht negativ, da es sich um das Quadrat der Entfernungen handelt. Der Bereich der Varianz ist jedoch nicht beschränkt und hängt von der jeweiligen Verteilung ab. Die Varianz einer konstanten Zufallsvariablen ist Null, und die Varianz ändert sich nicht in Bezug auf einen Standortparameter.
Mehr über Kovarianz
In der statistischen Theorie ist die Kovarianz ein Maß dafür, wie viele zwei zufällige Variablen zusammen verändern. Mit anderen Worten, Kovarianz ist ein Maß für die Stärke der Korrelation zwischen zwei zufälligen Variablen. Außerdem kann es als Verallgemeinerung des Varianzkonzepts zweier Zufallsvariablen angesehen werden.
Kovarianz von zwei zufälligen Variablen x und y, die gemeinsam mit endlicher zweiter Impuls verteilt sind, ist als σ bekanntXy= E [(x-e [x]) (y-e [y])]. Daraus kann Varianz als Sonderfall der Kovarianz angesehen werden, bei denen zwei Variablen gleich sind. COV (x, x) = var (x)
Durch Normalisierung der Kovarianz kann der lineare Korrelationskoeffizient oder der Korrelationskoeffizient des Pearson erhalten werden, der als ρ = e [(x-e [x]) (y-e [y])]/(σ definiert istX σY ) = (COV (x, y))/(σX σY)
Grafisch kann die Kovarianz zwischen einem Datenpunktpaar als Bereich des Rechtecks mit den Datenpunkten an den gegenüberliegenden Eckpunkten angesehen werden. Es kann als Maß für die Größenordnung der Trennung zwischen den beiden Datenpunkten interpretiert werden. In Anbetracht der Rechtecke für die gesamte Bevölkerung kann die Überlappung der Rechtecke, die allen Datenpunkten entsprechen, als die Stärke der Trennung angesehen werden. Varianz der beiden Variablen. Die Kovarianz ist aufgrund von zwei Variablen in zwei Dimensionen, aber die Vereinfachung einer Variablen ergibt die Varianz einer einzelnen als Trennung in einer Dimension.
Was ist der Unterschied zwischen Varianz und Kovarianz?
• Die Varianz ist das Maß für die Ausbreitung/ Dispersion in einer Population, während die Kovarianz als Maß für die Variation von zwei Zufallsvariablen oder die Stärke der Korrelation angesehen wird.
• Varianz kann als Sonderfall der Kovarianz betrachtet werden.
• Varianz und Kovarianz hängen von der Größe der Datenwerte ab und können nicht verglichen werden. Daher werden sie normalisiert. Die Kovarianz wird in den Korrelationskoeffizienten normalisiert (durch das Produkt der Standardabweichungen der beiden Zufallsvariablen) und die Varianz wird in die Standardabweichung normalisiert (durch Einnahme der Quadratwurzel)