Grenzen der Normalverteilungsannahme

06/08/2009 - 08:43 von Udo | Report spam
Hallo,

die Körpergröße wird in der Medizin üblicherweise als normalverteilte
Zufallsgröße behandelt, mit der man Mittelwertsvergleiche über
statistische Hypothesentests wie z.B. den t-Test rechnet, der
normalverteilte Grundgesamtheiten voraussetzt.

Aber eigentlich ist die Körpergröße nicht normalverteilt, da große
Werte (kein Mensch kann 5m groß werden) "von Natur aus" nicht
realisiert werden. Zwar liegt eine symmetrische Verteilung um den
Erwartungs- bzw. Mittelwert vor, aber im Gegensatz zur
Normalverteilung bleiben sehr kleine und große Werte außen vor.
Also dürfte man doch eigentlich mit Größen, die nur in einem Bereich
um den Erwartungswert realisiert werden, keinen t-Test rechnen?

Als Extrembeispiel fand ich in einem Artikel (eines renommierten
Fachblattes) folgendes Szenario:
Befragung zweier Gruppen, 20 Fragen, je Antwort 5 Kategorien möglich,
von: völlige Zustimmung (Codierung=1) bis völlige Ablehnung
(Codierung=5).
Die Autoren berechnen jetzt je Frage/Antwort den Score-Mittelwert und
die Standardabweichung und vergleichen die Gruppen anhand dieses
Mittelwerts mittels t-Test auf signifikanten Unterschied.

OK - Es liegt eine Ordinalskala vor, auf der eigentlich keine
Mittelwertberechnung sinnvoll ist - aber sei's drum. In der Medizin
wird das stàndig mit irgenwelchen Scores gemacht.


Meine Frage:
Die Annahme, die Score-Mittelwerte seien normalverteilt (Voraussetzung
für den t-Test) ist doch wohl gewagt. Der Bereich für mögliche
Mittelwerte ist im Beispiel noch eingeschrànkter
W = { 1 <= M <= 5 } als etwa bei der Körpergröße.
Warum können die Körpergröße wie auch andere Größen als normalverteilt
behandelt werden, wenn große Teile des Normalverteilungsbereiches gar
nicht realisiert werden (können)?
Wie ist das beim vorgestellten Score-Beispiel, wenn der Bereich noch
schmaler ist? Wo liegt hier die Grenze?

Freundliche Grüße
Udo
 

Lesen sie die antworten

#1 Gus Gassmann
06/08/2009 - 12:55 | Warnen spam
On Aug 6, 3:43 am, Udo wrote:
Hallo,

die Körpergröße wird in der Medizin üblicherweise als normalverteilte
Zufallsgröße behandelt, mit der man Mittelwertsvergleiche über
statistische Hypothesentests wie z.B. den t-Test rechnet, der
normalverteilte Grundgesamtheiten voraussetzt.

Aber eigentlich ist die Körpergröße nicht normalverteilt, da große
Werte (kein Mensch kann 5m groß werden)  "von Natur aus" nicht
realisiert werden. Zwar liegt eine symmetrische Verteilung um den
Erwartungs- bzw. Mittelwert vor, aber im Gegensatz zur
Normalverteilung bleiben sehr kleine und große Werte außen vor.
Also dürfte man doch eigentlich mit Größen, die nur in einem Bereich
um den Erwartungswert realisiert werden, keinen t-Test rechnen?

Als Extrembeispiel fand ich in einem Artikel (eines renommierten
Fachblattes) folgendes Szenario:
Befragung zweier Gruppen, 20 Fragen, je Antwort  5 Kategorien möglich,
von:  völlige Zustimmung (Codierung=1) bis völlige Ablehnung
(Codierung=5).
Die Autoren berechnen jetzt je Frage/Antwort den Score-Mittelwert und
die Standardabweichung und vergleichen die Gruppen anhand dieses
Mittelwerts  mittels t-Test auf signifikanten Unterschied.

OK - Es liegt eine Ordinalskala vor, auf der eigentlich keine
Mittelwertberechnung sinnvoll ist - aber sei's drum. In der Medizin
wird das stàndig mit irgenwelchen Scores gemacht.

Meine Frage:
Die Annahme, die Score-Mittelwerte seien normalverteilt (Voraussetzung
für den t-Test) ist doch wohl gewagt. Der Bereich für mögliche
Mittelwerte ist im Beispiel noch  eingeschrànkter
W = { 1 <= M <= 5 }  als etwa bei der Körpergröße.
Warum können die Körpergröße wie auch andere Größen als normalverteilt
behandelt werden, wenn große Teile des Normalverteilungsbereiches gar
nicht realisiert werden (können)?
Wie ist das beim vorgestellten Score-Beispiel, wenn der Bereich noch
schmaler ist? Wo liegt hier die Grenze?

Freundliche Grüße
Udo



Du mußt zweierlei unterscheiden, die Verteilung der unterliegenden
Gesamtmenge, und die Verteilung der Mittelwerte. Für letztere gibt es
einen ungeheuer wichtigen Satz, den zentralen Grenzwertsatz, der
besagt, daß, unabhàngig von der Verteilung der Gesamtmenge,
Mittelwerte ungefàhr normalverteilt sind, wenn nur die Stichprobe
genügend viele Elemente umfaßt. Auch wichtig: es handelt sich nur um
ungefàhre Normalverteilungen, der Blickpunkt ist auf die Mitte der
Verteilung gerichtet, und was an den Enden genau passiert, ist
unerheblich für diese Analyse. Wenn es darum geht, die maximale
Körpergröße zu studieren und Wahrscheinlichkeiten extremer Werte zu
bestimmen, ist der Mittelwert reichlich unbedeutend.

Ähnliche fragen