Statistik: Varianz, Erwartungstreue, Freiheitsgrade

15/10/2008 - 01:45 von ferdinand.gruebler | Report spam
Hallo,

Ich versuche gerade zu verstehen, warum man die quadrierten
Abweichungen mit n/(n-1) multipliziert, will man die Varianz der
Population ausgehend von Stichprobendaten schàtzen.

Grundsàtzlich glaube ich das Konzept der Freiheitsgrade verstanden zu
haben;
In die Schàtzung der Varianz geht der geschàtzte Mittelwert ein.
Ausgehend davon, können n-1 Werte frei variieren. Mindestens ein Wert
ist festgelegt, da ja alle Werte zusammengenommen den Mittelwert
ergeben muss.

Dennoch leuchtet mir die Formel nicht ein ...

Ist das n/(n-1) die statistische Wahrscheinlichkeit einer
Nullabweichung?

Angenommen ich habe folgende drei Werte: 14, 15, 16

Die Varianz mit 1/n ergebe:
1/n (1 + 0 + 1) = 1/3 * 2 = 0,666

Der mittlere Werte der Reihe ist zugleich der Mittelwert. Die
Abweichung ist daher null.

Bei der korrigierten Varianzformel wird diese 0-Abweichung heraus
gerechnet:
1/(n-1) (1 + 0 + 1) = 1/2 *2 = 1


Die Summe aller Abweichungen vom Mittelwert ist 0.
Liegt da der Grund versteckt für 1/(n-1) ?


Ich hoffe mein Ansatz ist nicht zu chaotisch ... ich weiß einfach
nicht wie das Ganze in eine plausiblen Erklàrung münden könnte ...
Kann mir das irgendjemand laienhaft erklàren? Was bedeutet dieses
ominöse n/(n-1)?
 

Lesen sie die antworten

#1 Sebastian Starosielec
15/10/2008 - 07:45 | Warnen spam
On Tue, 14 Oct 2008 16:45:11 -0700, ferdinand.gruebler wrote:

Hallo,

Ich versuche gerade zu verstehen, warum man die quadrierten Abweichungen
mit n/(n-1) multipliziert, will man die Varianz der Population ausgehend
von Stichprobendaten schàtzen.



Weil der Mittelwert deiner Stichprobe (im Unterschied zum Mittelwert der
Population) nicht unabhàngig von der Stichprobe ist.

Rechne es doch einfach selbst aus, in dem Du die Doppelsummen betrachtest:

m(x) = sum_i x_i / n
s²(x) = sum_j (x_j - m(x))^2

Berechne <s²(x)> mit den Rechenregeln:
<x_i> = <x>
<x_i x_i> = <x^2>
<x_i x_j> = <x>^2 (für i != j)

und vergleiche <s²(x)> mit sigma²(x) = <x^2> - <x>².

Der Grund für die (n-1) ist in der Diagonalen deiner Doppelsumme, die Du
gesondert behandeln musst, weil m(x) von x_j abhàngig ist.

Ähnliche fragen