Plausibilitaet von Geburtenzahlen

11/09/2010 - 00:47 von Ralf . K u s m i e r z | Report spam
X-No-Archive: Yes

begin Thread


Moin!

Ich habe da gerade mal wieder von einem Statistikamt einen Satz
amtliche Geburtenzahlen eines Landes nach Geschlecht, Jahr und
Gemeinden bekommen. In dem betreffenden Land gibt es ca. 1000
Gemeinden.

Mit der Zeit entwickelt man ein gewisses Mißtrauen in die
Datenqualitàt solcher Zahlen - die werden auch nur von Menschen
zusammengestellt, und die sind bekanntlich fehlbar. Also sollte man
statistische Zahlen grundsàtzlich auf Plausibilitàt überprüfen. Aber
wie?

Ein Beispiel:

Für eine bestimmte Gemeinde sind folgende Geburtenzahlen angegeben
(dahinter die Zahlen für das gesamte Land):

Gemeinde Land
Jahr m f m f
2004 8 0 12416 11674
2005 9 3 11779 11248
2006 10 2 11727 10959
2007 3 7 11895 11066

m: Jungen
f: Màdchen

Die Gemeindezahlen sehen über den dicken Daumen gepeilt /ein bißchen/
unwahrscheinlich aus - das Verhàltnis Jungen:Màdchen weicht in allen
Jahren ziemlich stark von 1 ab. Aber wie unwahrscheinlich ist genau
diese Verteilung nun wirklich?

Dabei sollte man vielleicht nicht nur das Geschlechterverhàltnis in
jedem Jahr betrachten, sondern auch die Zeitentwicklung: Abrupte
Verànderungen der Gesamtzahl der Geburten in aufeinanderfolgenden
Jahren sind auch unwahrscheinlich (allerdings sind die Zahlen
diesbezüglich nicht auffàllig: 8, 12, 12, 10).


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus
 

Lesen sie die antworten

#1 Gus Gassmann
11/09/2010 - 01:49 | Warnen spam
On Sep 10, 7:47 pm, "Ralf . K u s m i e r z"
wrote:
X-No-Archive: Yes

begin  Thread

Moin!

Ich habe da gerade mal wieder von einem Statistikamt einen Satz
amtliche Geburtenzahlen eines Landes nach Geschlecht, Jahr und
Gemeinden bekommen. In dem betreffenden Land gibt es ca. 1000
Gemeinden.

Mit der Zeit entwickelt man ein gewisses Mißtrauen in die
Datenqualitàt solcher Zahlen - die werden auch nur von Menschen
zusammengestellt, und die sind bekanntlich fehlbar. Also sollte man
statistische Zahlen grundsàtzlich auf Plausibilitàt überprüfen. Aber
wie?

Ein Beispiel:

Für eine bestimmte Gemeinde sind folgende Geburtenzahlen angegeben
(dahinter die Zahlen für das gesamte Land):

        Gemeinde      Land
   Jahr   m   f     m       f
   2004   8   0   12416   11674
   2005   9   3   11779   11248
   2006  10   2   11727   10959
   2007   3   7   11895   11066

 m: Jungen
 f: Màdchen

Die Gemeindezahlen sehen über den dicken Daumen gepeilt /ein bißchen/
unwahrscheinlich aus - das Verhàltnis Jungen:Màdchen weicht in allen
Jahren ziemlich stark von 1 ab. Aber wie unwahrscheinlich ist genau
diese Verteilung nun wirklich?



Die übliche Methode in diesem Fall ist der Chi-Quadrat-Test (http://
de.wikipedia.org/wiki/Chi-Quadrat-Test). Nimm die Landeszahlen, um die
Erwartungswerte zu schàtzen. Die geschàtzten Erwartungswerte sind zwar
ein wenig klein, aber der Unterschied ist trotzdem signifikant. Die
Zahlen sind in der Tat ungewöhnlich.

Dabei sollte man vielleicht nicht nur das Geschlechterverhàltnis in
jedem Jahr betrachten, sondern auch die Zeitentwicklung: Abrupte
Verànderungen der Gesamtzahl der Geburten in aufeinanderfolgenden
Jahren sind auch unwahrscheinlich (allerdings sind die Zahlen
diesbezüglich nicht auffàllig: 8, 12, 12, 10).

Ähnliche fragen