Stichprobengenauigkeit

29/06/2009 - 14:05 von Norbert Pürringer | Report spam
Hallo Leute,

ich habe folgendes Problem:

Es soll ein Modell mit vielen diskreten Werten getestet werden und
deren Werte mit bekannten Fixwerten verglichen werden. Es ergeben sich
in der Stichprobe mehrere Abweichungen (von den Fixwerten) mit der
Einheit Meter. Ich habe z.B. in einer Probe 184 Abweichungen und in
der anderen Probe 112 Abweichungen vorliegen.

Es wird nun bei einem Konfidenzintervall von 90% eine zu erreichende
"Maximalabweichung" gefordert.

Ich habe nun all jene Abweichungen gezàhlt, die diese
Maximalabweichung nicht überschreiten, und diese durch die
Stichprobenmenge dividiert.

Bei Probe 1 komme ich auf 91,8%, bei Probe 2 auf 94,6%. Beide Proben
würden somit die "Genauigkeitsanforderungen" erfüllen. Beide Werte
liegen über 90%.

Nur möchte ich wissen, wie sicher diese statistischen Größen sind.
Aufgrund des Stichprobenumfanges ergibt sich eine Unschàrfe. Wie
berechne ich diese Unschàrfe?

Ich würde gerne folgendes angeben: Probe 1: 91,8% +/- xxx

Diese Genauigkeit könnte wieder mit dem Konfidenzintervall von 90%
angegeben werden.

Wie rechne ich diese Genauigkeit aus? So ein richtiger Statistiker bin
ich leider nicht.

Gruß,
Norbert
 

Lesen sie die antworten

#1 Jakob Creutzig
29/06/2009 - 19:43 | Warnen spam
Norbert Pürringer writes:

Es ergeben sich
in der Stichprobe mehrere Abweichungen (von den Fixwerten) mit der
Einheit Meter. Ich habe z.B. in einer Probe 184 Abweichungen und in
der anderen Probe 112 Abweichungen vorliegen.

Es wird nun bei einem Konfidenzintervall von 90% eine zu erreichende
"Maximalabweichung" gefordert.



Der Satz ist mir nicht ganz klar. Heisst das, man sucht eine
Abweichung, die nur in 90% der Faelle ueberschritten wird?

Oder will man eine Schaetzung mit 90% Konfidenz, wie viele
Prozent an Messungen ueber einer gegebenen Maximalabweichung
sind?

Ich habe nun all jene Abweichungen gezàhlt, die diese
Maximalabweichung nicht überschreiten, und diese durch die
Stichprobenmenge dividiert.

Bei Probe 1 komme ich auf 91,8%, bei Probe 2 auf 94,6%. Beide Proben
würden somit die "Genauigkeitsanforderungen" erfüllen. Beide Werte
liegen über 90%.

Nur möchte ich wissen, wie sicher diese statistischen Größen sind.
Aufgrund des Stichprobenumfanges ergibt sich eine Unschàrfe. Wie
berechne ich diese Unschàrfe?

Ich würde gerne folgendes angeben: Probe 1: 91,8% +/- xxx

Diese Genauigkeit könnte wieder mit dem Konfidenzintervall von 90%
angegeben werden.



Okay, das hoert sich erst mal so an, als moechtest Du einfach
schaetzen, wie wahrscheinlich das Ereignis "ein beliebiges Teil
weicht mehr als $Wert vom Fixwert ab". Das laeuft unter dem
Namen "Konfidenzschaetzung im Binomialmodell" (man hat eine
unahbaengige Folge von "passt"-"kaputt"-"passt"-"passt" etc.);
wenn man N Daten und k "Treffer" (also "mehr als Maximalabweichung")
hat, ist fuer die unbekannte Wahrscheinlichkeit

p = P("das naechste Teil ist ausserhalb der Maximalabweichung")

die beste Schaetzung natuerlich durch k/N gegeben.

Die "richtige" Methode hingegen, um ein Konfidenzintervall zu
erhalten, ist leider ein bisschen kompliziert; meist aehnlich
gut (ab, sagen wir, n00 auf jeden Fall) funktioniert
aber die etwas groebere Methode, die zugrundeliegende
Binomialverteilung durch Normalverteilung zu approximieren.
Ich nenn das Gesuchte lieber eps statt xxx, dann kann man waehlen
(ich schreib mal nur das Ergebnis auf, die Rechnung selbst ist
langweilig):

eps = Phi^{-1}( (90% + 1.02)/2) / (2 * sqrt{N})
= Phi^{-1}(0.991)/sqrt{4 N}

Hierbei ist Phi die Verteilungsfunktion der Standardnormalverteilung.

Und weil wir in ds*math* sind: Das da oben ist reichlich hemdsaermlig,
besonders die 1.02 anstatt 1 als "Sicherheitsmarge gegen Fehler durch
Normalapproximation", aber man kann es mit der exakten Methode
vergleichen und stellt fest, dass es fuer n00 konsistent groessere
Konfidenzintervalle liefert (und zwar 5-10% groessere, was ziemlich
gut ist).

Best,
Jakob

Ähnliche fragen