Simpson-Paradoxon?

01/03/2008 - 02:51 von Ralf Kusmierz | Report spam
X-No-Archive: Yes

begin Thread


Moin!

Puh, mir raucht der Kopf ...

Folgendes:
Jemand hat festgestellt; daß eine bestimmte seltene Krankheit in
dichter besiedelten Regionen eine höhere Inzidenz hat.

Beweis:
Er hat sich von einem Forschungszentrumm die (vollstàndige) Liste der
Erkrankungszahlen, die in hundert Landkreisen in einem Zeitraum
aufgetreten sind, geben lassen, diese mit der Bevölkerungsdichte in
den Landkreisen verglichen und festgestellt, daß die Erkrankungsquote
positiv mit der Bevölkerungsdichte (=durchschnittliche Einwohnerzahl
pro km^2) korreliert ist.

Also ist das Erkrankungsrisko in der Stadt höher als auf dem Dorf?
Bestimmt, aber wieviel?

Nun ja, es gibt unterschiedliche Landkreise, solche mit einigen dicht
besiedelten Stàdten darin, und andere, die mehr aus Dörfern bestehen.
Dazwischen muß man bestimmt differenzieren. Wie mag die Abhàngigkeit
nun genau sein?

Ich habe mir mal die Zahlen geben lassen - sind natürlich nur
kumuliert pro Landkreis verfügbar, nicht einzeln für jede Gemeinde.
Blöd...

Na, macht nichts, da machen wir einfach eine Korrelationsrechnung.
Ansatz:

Für die Inzidenz nehme ich ein lineares Modell an, d. h. die
Erkrankungsquote q besteht aus eines Konstanten q0 und einem linearen
Koeffizienten q1, so daß für jede Gemeinde ein q mit

q = q0 + q1*D

angenommen wird, wobei D die Bevölkerungsdichte in der Gemeinde
darstellt. Die Anzahl der zu erwartenden Fàlle F ergibt sich dann zu

F = E*q = E*(q0 + q1*D)

mit der Einwohnerzahl E der Gemeinde.

Nun addiere ich die F_i für alle Gemeinden i = 1..n eines Landkreises
und bilde die Differenz zu der bekannten Zahl der erfaßten Fàlle in
dem Landkreis. Schließlich schàtze ich die Koeffizienten q0 und q1,
indem ich die Summe der mit den Einwohnerzahlen der Landkreise
gewichteten Quadrate der Differenzen bilde und minimiere, dann weiß
ich, wie gesund das Landleben nun wirklich ist.

Pfiffig, nicht?

So, jetzt kommt's: q1 ist signifikant negativ!

Hat jemand 'ne Idee?


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus
 

Lesen sie die antworten

#1 earthnut
02/03/2008 - 04:04 | Warnen spam
Ralf Kusmierz wrote:

Jemand hat festgestellt; daß eine bestimmte seltene Krankheit in
dichter besiedelten Regionen eine höhere Inzidenz hat.

[...]

Für die Inzidenz nehme ich ein lineares Modell an, d. h. die
Erkrankungsquote q besteht aus eines Konstanten q0 und einem linearen
Koeffizienten q1, so daß für jede Gemeinde ein q mit

q = q0 + q1*D

angenommen wird, wobei D die Bevölkerungsdichte in der Gemeinde
darstellt.

[...]

So, jetzt kommt's: q1 ist signifikant negativ!

Hat jemand 'ne Idee?



Kannst du aus den Daten die du hast einen kleinen Satz auswàhlen, bei
dem das (nicht notwendig signifikant) auch schon auftritt und hier
posten?

Bastian

Ähnliche fragen