Taxis in Venedig

21/07/2009 - 14:44 von Udo | Report spam
Hallo,

ich war einige Tage als Touri in Venedig, und beim Relaxen am Canal
Grande fuhren stàndig Taxiboote an mir vorüber. Alle trugen eine
eindeutige Zulassungsnummer, so dass ich mir die Frage stellte: Wie
viele Wassertaxis wird es wohl in Venedig geben?
Ich schrieb mir also die Nummern der nàchsten 10 Boote, die
vorbeifuhren, auf und rechnete spàter im Hotel Folgendes:
(Modellvoraussetzung: die Nummern der Taxis sind eindeutig von 1 bis n
durchnummeriert)

Nummern-Stichprobe (n = 10)
-
31
112
358
279
92
268
159
77
98
207
-

Mittelwert der Stichprobe m = 168.1
StandAbw der Stichprobe s = 105.9
Geschàtzt. StandFehler SEM = s / SQRT(n) = 105.9 / SQRT(10) = 33.5

Das heißt, die Mittelwerte (aller möglichen) Stichproben der Größe
n sind annàhernd normalverteilt und
streuen mit einer Standardabweichung von SEM = 33.5

Wenn M der 'wahre' Mittelwert der Grundgesamtheit aller Bootsnummern
ist:
M = Summe(1 bis n) * 1/ n = n*(n+1)/2 * 1/n = (n+1)/2

liegen 95% aller möglichen Stichproben-Mittelwerte zwischen (M -
1.96*SEM) und (M + 1.96*SEM) oder anders:
der wahre Mittelwert der Grundgesamtheit liegt entsprechend in der
Nàhe des empirischen Stichprobenmittelwertes
m - 1.96*SEM <= M <= m + 1.96*SEM
das heißt:
(168.1 - 1.96 * 33.5 ) <= M <= (168.1 + 1.96 * 33.5)

Der wahre Mittelwert M (auf Basis der notierten Stichprobe) liegt also
zwischen 102.5 und 233.7
Werte unterhalb oder oberhalb dieser Grenzen sind mit je 2.5% eher
unwahrscheinlich.

Da für M obige Formel gilt: M = (n+1)/2 ergibt sich nach n
aufgelöst n = 2*M - 1
und damit als Schàtzung K für die Anzahl der Wassertaxis
(Konfidenzintervall)
minimale Anzahl: 204
maximale Anzahl: 466

Was mir jetzt nicht klar ist - meine Frage:
Ich hatte beim Ziehen der Stichprobe Glück, dass ich nicht zweimal
dasselbe Taxi gesehen habe. Wie muss ich vorgehen, wenn ein Taxi das
zweite Mal vorbeikommt? Darf eine bestimmte Taxinummer in ein und
derselben Stichprobe zweimal (oder mehrmals) auftreten (Urnen-Modell
mit Zurücklegen) oder muss ich die Nummer ignorieren und warten, bis
ein anderes Boot kommt (hypergeometrisches Modell ohne Zurücklegen)?

Kann mir den genauen Sachverhalt jemand erklàren? Hat wohl irgendwas
mit Unabhàngigkeit der Ereignisse zu tun, aber ich krieg's nicht
zusammen.

Danke für die Hilfe
Udo
 

Lesen sie die antworten

#1 Christopher Creutzig
21/07/2009 - 23:03 | Warnen spam
Udo wrote:

Nummern-Stichprobe (n = 10)

358

minimale Anzahl: 204



Vor lauter Modellieren übersieh bitte nicht, dass Du schon etwas mehr
beobachtet hast. :-)

Ich hatte beim Ziehen der Stichprobe Glück, dass ich nicht zweimal
dasselbe Taxi gesehen habe. Wie muss ich vorgehen, wenn ein Taxi das
zweite Mal vorbeikommt? Darf eine bestimmte Taxinummer in ein und
derselben Stichprobe zweimal (oder mehrmals) auftreten (Urnen-Modell
mit Zurücklegen) oder muss ich die Nummer ignorieren und warten, bis
ein anderes Boot kommt (hypergeometrisches Modell ohne Zurücklegen)?



Wie bist Du denn überhaupt auf die Annahme gekommen, die Mittelwerte
seien nàherungsweise normalverteilt? Vermutlich doch über so etwas wie
den zentralen Grenzwertsatz (wobei ich nachrechnen müsste, ob n dafür
eigentlich schon genügt). Der gilt aber nur für unabhàngige, identisch
verteilte ZV – also *musst* Du Taxis, die mehrmals vorbeikommen,
mehrfach zàhlen.

Ob die Herleitung ansonsten schlüssig ist, habe ich nicht im Detail
überlegt, ich bin auch wahrlich kein Stochastiker. Richtige Böcke sind
mir nicht aufgefallen, ich finde den Ansatz jedenfalls nicht
uninteressant. Wie gesagt, die Größe der Stichprobe könnte ein Problem sein.

Für zuverlàssige Statistiken sind bislang noch
nicht ausreichend viele Universen beobachtet worden.
[Hans Crauel zur Zuverlàssigkeit von Klimamodellen]

Ähnliche fragen