Varianz

19/09/2007 - 17:47 von worstkart | Report spam
Kennt sich jemand mit Varianzen aus?
Wenn die Verteilungsform nicht von der Einheit abhàngt, also zwei
unterschiedliche Varianzen die gleiche Kurve definieren können, dann
müssen doch zwei Varianzen im selben Maßstab ja auch nicht
unterschiedliche Kurven definieren.
Ist es also richtig, dass die Varianz allein nicht die Form der Kurve
definiert, sondern nur angibt dass 66 Prozent der Population
innerhalb
der ersten SD, u.s.w., liegen?

Statt einer Population, die mit zwei Maßstàben bez. des selben
Merkmals gemessen wird, nehme man im Geiste zwei Populationen die mit
dem gleichen Massstab gemessen werden.
Aber sonst lasse man die Verteilungen der Zahlen und die Zahlen
selbst
gleich. Wenn es nur auf die Zahlen ankommt, dann ist es gleich ob man
eine Population mit sich selbst oder zwei Populationen miteinander
vergleicht.
Darum begreife ich nicht warum eine geringe Varianz immer eine
schmale, hohe und eine große Varianz immer eine breite, flache Kurve
definieren soll und scheinbar sind die immer bis auf den Punkt gleich
definiert.


Danke euch herzlich
 

Lesen sie die antworten

#1 Daniel Samaga
19/09/2007 - 18:38 | Warnen spam
wrote:

Hui, Dein Posting liest sich etwas wirr - im ersten Moment dachte ich,
dass Du trollst. Aber ich geb mal mein bestes.

Kennt sich jemand mit Varianzen aus?
Wenn die Verteilungsform nicht von der Einheit abhàngt, also zwei
unterschiedliche Varianzen die gleiche Kurve definieren können, dann
müssen doch zwei Varianzen im selben Maßstab ja auch nicht
unterschiedliche Kurven definieren.


Inwiefern definiert denn eine Varianz eine Kurve?
Ich schaetze, dass Du mit Kurve Dichtefunktion meinst. Und dann
definiert die Varianz nicht diese, sondern die Art der Verteilung
(Normal-, Exponential, Binomial, Gleich-, etc.) und, wie Du es
vermutlich richtig erraten hast, ist die Varianz einer der Parameter,
die Du (alle) brauchst, um das Ding dann hinzuzeichnen. Man kann das
auch so sehen, dass eine Verteilung(sart) eine Klasse von solchen
'Kurven' beschreibt, und durch die Wahl der Parameter dann eine solche
ausgewaehlt wird.

Da Du von Einheiten sprichst. Es gilt unabhaengig von der Verteilung:
Wenn Y=a*X+b, dann ist Var(Y)=a^2*Var(X)
Entspricht also X einer Messung in m, dann ist mit a0, Y die
dazugehoerige Messung in cm. Die Verteilung aendert sich dadurch nicht -
wie die Kurve aussieht, liegt dann nur noch an der x- und
y-Achseneinteilung - und somit kriegst Du die beiden (hier Histogramme
etc.) deckungsgleich gezeichnet, was ja Sinn macht.

Ist es also richtig, dass die Varianz allein nicht die Form der Kurve
definiert, sondern nur angibt dass 66 Prozent der Population
innerhalb
der ersten SD, u.s.w., liegen?


Diesen Abschnitt hab ich versucht vorwegzunehmen. Und wie viel Prozent
innerhalb irgendwas liegt, kann man nur bei konkret gegebener
Verteilung(sart) sagen. Hier spielst Du wohl auf die Normalverteilung
an. Bei frei gewaehlter Verteilung koennen ja auch 0% innerhalb des
ersten Streubereichs liegen.


Statt einer Population, die mit zwei Maßstàben bez. des selben
Merkmals gemessen wird, nehme man im Geiste zwei Populationen die mit
dem gleichen Massstab gemessen werden.


soweit ok
Aber sonst lasse man die Verteilungen der Zahlen und die Zahlen
selbst
gleich.


wie jetzt? Wie viele Populationen (=Verteilungen oder Stichproben aus
wie vielen Grundgesamtheiten) haben wir denn jetzt? Ich schaetze 2
Populationen. Aber was soll ich denn gleich lassen? Die Zahlen, dann
sind die zwei Populationen doch identisch, und ich hab wieder nur eine.
Haeh?!?
Wenn es nur auf die Zahlen ankommt, dann ist es gleich ob man
eine Population mit sich selbst oder zwei Populationen miteinander
vergleicht.


Und wieso denn jetzt vergleichen? ich dachte, wir bestimmen Varianzen...
;-) Aber gut - vielleicht bezeichnet vergleichen ja, Varianzen
bestimmen, weil quasi Elemente Populationen paarweise verglichen werden
- dazu musst Du Dich aber auf einen Massstab festgelegt haben, hoffe ich.
Darum begreife ich nicht warum eine geringe Varianz immer eine
schmale, hohe und eine große Varianz immer eine breite, flache Kurve
definieren soll


Diese Stelle musst Du dringen nochmal ausfuehren. wenn
X Normalverteilt (0,100) (Mittelwert,Varianz) und
Y Normalverteilt (0,10),
dann ist Y einfach 10-mal so breit wie X, oder nicht? Ist ja auch klar,
weil sich dort gleichviele Werte auf einen 10-fachen Bereich ausdehnen.
Und weil X verhaeltnismaessig wenige Werte nahe 0 hat, ist die Dichte
dort um einen gewissen Faktor geringer (Bei 0 genau Faktor 10, danach
aendert sich der natuerlich, weil aussen die Dichte der breitgestreuten
Werte natuerlich im Vergleich zu den engen Y-Werten dichter wird)
und scheinbar sind die immer bis auf den Punkt gleich
definiert.


Danke euch herzlich



Diesem Gedankenexperiment kann ich leider nicht folgen - und ich hab es
ehrlich versucht...

Aber vielleicht reichte Dir ja schon der Punkt - dass Du natuerlich
recht hast, dass die Varianz einer Menge alleine so ziemlich nix
aussagt. Bei bekannter Verteilung (und anderen fehlenden Parametern)
gibt sie aber ein schnelles Gefuehl von der Lage einer Menge von Werten
und das ist nuetzlich. Ich hoffe, ich konnte entweder helfen, oder Dich
ermuntern, dein Problem nochmal etwas herauszuputzen und auf den Punkt
zu bringen.

Gruss

Ähnliche fragen