KiKK-Studie - Methode

22/12/2007 - 17:09 von Ralf Kusmierz | Report spam
X-No-Archive: Yes

begin Thraed


Hallo,

ich habe mir mal die vieldiskutierte Studie des Kinderkrebsregisters
zur Hàufung kindlicher Krebserkrankungen in der Umgebung von
Kernkraftwerken angesehen und versuche zu verstehen, was die
eigentlich gemacht haben.

Wie ich es bisher verstanden habe, war das Vorgehen das folgende:

Man nehme alle Erkrankungsfàlle der betreffenden Kohorte (waren ca.
1.500). Für jeden Fall wird Geschlecht und Geburtsdatum bestimmt und
aus den Meldeamtsdaten eine dafür repràsentative Zufallsstichprobe im
Umfang von mindestens drei Elementen aus der Bevölkerung in der
Umgebung eines dem "Fall" benachbarten Kernkraftwerks gezogen.
Repràsentativ ist die Stichprobe insofern, daß es sich um drei
(annàhernd) gleichalte Kinder des gleichen Geschlechts handelt, wobei
bei der Wahrscheinlichkeit, mit der eine bestimmte Gemeinde aus dem
Untersuchungsgebiet ein Kontrollgruppenelement "spendete", die
Besetzungsdichte, also die Anzahl der Elemente aus der
Grundgesamtheit, berücksichtigt wurde.

Dazu aus der Studie:

2.3.2 Zeitpunkt der Diagnose, Alter, Geschlecht
Zu jedem Fall wurde das folgende Prozedere 6-mal durchgeführt. Über
den Ortsmittelpunkt (s.o.) wird der Fall vorlàufig einer
Kernkraftwerksregion zugeordnet. Bekannt ist die Anzahl aller Kinder
im Diagnosejahr des Falls mit gleichem Geschlecht und im
entsprechenden Alter in den zugeordneten Gemeinden. Die
Wahrscheinlichkeit einer Gemeinde, als Wohnort für die Kontrollziehung
ausgewàhlt zu werden, entspricht dem Bevölkerungsanteil je
Alter/Geschlecht/Jahr über alle Gemeinden der betreffenden
Kernkraftwerksregion. Praktisch lief das Vorgehen somit jedes Mal auf
die gewichtete Zufallsauswahl einer Gemeinde hinaus. Der Vorgang
erfolgte für jeden Fall 6-mal. Über alle Fàlle ergab sich daraus je
Gemeinde eine Liste mit gewünschten Adressen. Dabei wurde zu jeder
Adresse vorgegeben, dass die Geburt in dem vorgegebenen Zeitrahmen zu
liegen hatte (siehe Tabelle 2.3) und das Kind im Monat der Diagnose
des entsprechenden Falls (Stichtag) in der ausgewàhlten Gemeinde
gelebt haben musste. Aus den 1.436 im Untersuchungsgebiet befindlichen
Gemeinden wurden auf diese Weise zu Kindern aus 1.084 Gemeinden
Adressen erbeten.
Dass eine Vorgabe nicht für das Alter sondern für den Geburtstag
erfolgte, hatte praktische Gründe. Der Geburtszeitraum wurde je nach
Gemeindegröße enger oder weiter gefasst, um aus einer handhabbaren
Zahl von potenziellen Kontrollen eine Auswahl treffen zu können
(Tabelle 2.3).

Tabelle 2.3: Vorgaben für die Kontrollziehung für den Geburtstag
der Kontrolle in Abhàngigkeit von der Gemeindegröße
Gemeindegröße
(Einwohner gesamt) Breite des Geburtszeitraums

<.000 gesamtes Kalenderjahr

10.000 bis < .000 ± 2,5 Monate
20.000 bis <P.000 ± 1 Monat
50.000 gleicher Monat



Wurden die Kontrollen als Listen oder Dateien geliefert, so wurde
möglichst die Kontrolle mit identischem oder nàchstgelegenem
Geburtsdatum wie der Fall ausgewàhlt.
Kamen mehrere Kinder in Frage, so wurde aus diesen eine einfache
Zufallsauswahl vorgenommen. Weitere Einzelheiten des technischen
Vorgehens der Kontrollziehung finden sich im Operationshandbuch.
Nach der Auswahl der Kontrollen wurde geprüft, ob nicht der Fall
selbst als Kontrolle ausgewàhlt worden war oder ein Kontrollkind zwei
verschiedenen Fàllen zugeordnet worden war. Da meist mehr potenzielle
Kontrolladressen vorlagen als erforderlich war, konnte dann auf diese
zurückgegriffen werden.
Um ein Matchverhàltnis von 1 zu 3 zu gewàhrleisten, wurde so von
vornherein versucht, pro Fall 6 Kontrollen zu rekrutieren. Die
potenziellen Kontrollen wurden bereits vor der Beschaffung mit den
Ziffern 1-6 durchnummeriert. Ziffern 1-3 waren die für die Auswertung
designierten Kontrollen. Von den Plàtzen 4-6 rückten Kontrollen
entsprechend nach, wenn eine oder mehrere der für die Plàtze 1-3
angesprochenen Gemeinden keine Kontrollen liefern konnten oder
wollten.
Aus praktischen Gründen mussten gelegentlich von dieser Vorgehensweise
Abweichungen erfolgen, wie z.B.:
· Ausdehnung des Geburtszeitraumes (bei kleinen Gemeinden),
· Ersetzen des Monats des Stichtags durch ein für das jeweilige
Einwohnermeldeamt übliches Stichdatum (z.B. den 31.12. des jeweiligen
Jahres),
· Kontrollziehung aus der aktuellen statt der damaligen
Wohnbevölkerung (führt implizit zum Ausschluss zwischenzeitlich
weggezogener Personen).
Wie hàufig diese Abweichungen erforderlich waren, wird tabellarisch in
Kapitel 3.1.2 zusammengestellt (Tabelle 3.3). Zusàtzlich wird dort
aufgeführt, wie viele Gemeinden Daten nicht oder nur für einen
bestimmten Zeitraum liefern konnten.

Quelle:
Umweltforschungsplan des Bundesumweltministeriums (UFOPLAN)
Reaktorsicherheit und Strahlenschutz, Vorhaben StSch 4334:
Epidemiologische Studie zu Kinderkrebs in der Umgebung von
Kernkraftwerken (KiKK-Studie)
Teil 1: (Fall-Kontroll-Studie ohne Befragung), S. 24 f.
Peter Kaatsch, Claudia Spix, Sven Schmiedel, Renate Schulze-Rath,
Andreas Mergenthaler, Maria Blettner
<http://www.kinderkrebsregister.de/p...l1.pdf>

Dann wurde für beide Stichproben ("Fàlle" und Kontrollgruppen) jeweils
das Abstandsmaß zur "verdàchtigen" Anlage bestimmt und ermittelt, ob
die die Erkrankten statistisch signifikant dichter am KKW gewohnt
hatten als die Elemente der Kontrollgruppe.

Falls ich es bis dahin richtig verstanden habe: Wie macht man das?

Ich würde so vorgehen (wenn ich auf eine solche Idee überhaupt kàme):

Als Abstandsmaß würde ich aus praktischen Gründen den Logarithmus der
Entfernung zwischen Wohnhaus und Kraftwerk nehmen. Dann würde ich den
Mittelwert x_ der Abstandsmaße aus den vier Elementen bestimmen sowie
einen Schàtzer sigma^ (welchen?) für deren Streuung und anschließend
die Differenz zwischen dem Abstandsmaß des "Falles" x_i und diese dann
auf die Streuung normieren, also

y_i(x_) = (x_i - x_) / sigma^

bestimmen, und anschließend würde ich nachsehen, ob y statistisch
signifikant von x_ abhàngt.

Wie haben es die Autoren gemacht, wie kommt man daraus auf eine
geschàtzte Funktion

OR(x) ~ RR(x) = 1 + f(x_) (S. 29 f.),

wie sie bspw. in Abbildung 3.4 S. 50 a. a. O. dargestellt ist?

Mit dem in der Studie angegebenen geschàtzten Koeffizienten komme ich
auf eine Schàtzung OR(r) für die Abstandsabhàngigkeit des relativen
Erkrankungsrisikos RR(r) zu

OR(r[km]) = exp(1,18/(r/km))

mit OR: Odds Ratio
r: Abstand des Wohnhauses vom Kraftwerksstandort

Tabelle (eigene Berechnung):

r/km | OR(r)-1
+--
1 | 225,44 %
2 | 80,40 %
3 | 48,19 %
4 | 34,31 %
5 | 26,62 %
10 | 12,52 %
15 | 8,18 %
20 | 6,08 %
30 | 4,01 %
40 | 2,99 %
50 | 2,39 %

aber wie kommt man an den Koeffizienten 1,18 (unterstellt, daß die
reziproke Abstandsabhàngigkeit eine gute Approximationsfunktion für
das "Risiko" ist)?

Weiter: Wie kann man die Qualitàt einer solchen Studie testen?

Was mir dazu einfiele, wàre, dieselben Rechnungen anstatt mit der
Krebs-Kohorte mal mit anderen Stichproben zu machen, etwa mit allen
Kindern, die aufgrund eines Unfalls für mehr als zwei Monate den
Kindergarten nicht besuchen konnten (oder irgendein Merkmal, das sich
auch gut praktisch erfassen làßt und hinreichend
"strahlungsunverdàchtig" ist), und zu sehen, ob sich dort ebenfalls
eine signifikante Abhàngigkeit ergibt. Ersatzweise könnte man auch
Stichproben aus den Kontrollgruppen ziehen, die müßten auf jeden Fall
befundfrei sein, dürften also keine Ungleichverteilung aufweisen.

Letztlich wàre auch eine parameterfreie Schàtzung interessant: Man
nimmt (im Prinzip) alle Kinderkrebsfàlle des Bundesgebiets, bestimmt
dazu ebenfalls Kontrollgruppen, schaut aber nun nicht nach
"verdàchtigen" Betrieben, sondern bildet einfach den
(zweidimensionalen) geometrischen Schwerpunkt aus Fall und
Kontrollelementen und schaut dann, ob sich aus den Richtungsvektoren
vom Schwerpunkt zum Fall statistisch signifikant lokale Gradienten
bestimmen lassen, die ihrerseits überzufàllige Cluster und
"Infektionszentren" anzeigen - damit hàtte man dann nicht die
Untersuchungsfrage der Studie beantwortet, sondern die Frage, ob sich
Clusterzentren finden - nachsehen, ob an dem Ort solcher statistischen
Schwerpunkte irgendwelche bedenklichen Einrichtungen sind, müßte man
dann unabhàngig davon.

(Es könnten sich rein hypothetisch aufschlußreiche Ergebnisse ergeben:
Nehmen wir einmal fiktiv an, eine solche Studie würde durchgeführt,
man fànde bisher nicht erkannte Risikocluster (die etwas anderes als
Fallcluster sind: Logischerweise hàufen sich Fàlle immer in
Siedlungsschwerpunkten, einfach deswegen, weil die Bevölkerungsdichte
dort hoch ist - das sagt aber nichts über das Risiko dort aus), und
überzufàllig hàufig würden sich in der Nàhe dieser statistischen
Schwerpunkte große Freiluftschaltanlagen, also Knotenpunkte der
Verteilung elektrischer Energie im Hochspannungsnetz, befinden, dann
wàre das zugleich eine Erklàrung für die Hàufung bei KKW: Auch dort
befinden sich natürlich stets große Freiluftschaltanlagen. Der Vorteil
einer parameterfreien Studie wàre, daß man nicht "Verdàchtige" testet,
sondern völlig unabhàngig Cluster sucht.)

Mir geht es bei diesem Posting übrigens hauptsàchlich um die Methode
und weniger um die Ökologie.

Mal eine andere Frage: Wie stehen die Chancen, daß die
zugrundeliegenden Daten anonymisiert veröffentlicht werden? Ich stelle
mir dabei eine Liste nach folgendem Aufbau vor:

lfd. Kontrollgruppe
Nr. sex Fall K1 K2 K3 K4 K5 K6
-
..
1212 m 12,49 17,83 10,51 9,22
1213 m 29,47 31,52 27,55 35,18 38,87
1214 w 11,28 21,61 7,32 10,42
..
..

also eine Liste aus dem Abstand für jeden (mit Geschlecht
bezeichneten) Fall und den Abstànden für die zugehörige
Kontrollgruppe. Diese Daten sollte es einerseits ermöglichen, die
Ergebnisse der Studie selbst nachzurechnen, aber hinreichend anonym
sein, um veröffentlicht werden zu können. Hat es wohl Sinn, beim
Kinderkrebsregister nach diesen Daten zu fragen?


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus
 

Lesen sie die antworten

#1 Ralf Kusmierz
26/12/2007 - 12:47 | Warnen spam
X-No-Archive: Yes

begin quoting, Ralf Kusmierz schrieb:

ich habe mir mal die vieldiskutierte Studie des Kinderkrebsregisters
zur Hàufung kindlicher Krebserkrankungen in der Umgebung von
Kernkraftwerken angesehen und versuche zu verstehen, was die
eigentlich gemacht haben.



Interessiert das eigentlich niemanden?


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus

Ähnliche fragen