Nr.2: Problemvorstellung: Hauptkomponenten-Vorzeichen abhaengig von Anordnung der Korrelationsmatrix

01/02/2014 - 09:58 von Rudolf Sponsel | Report spam
Nr.2 (Fragen veràndert)

Kurzfassung: Ändert man die Anordnung der Zeilen und Spalten einer
Korrelationsmatrix, können die Hauptkomponentenladungen ihr Vorzeichen
veràndern, was bei der Interpretation zu fatalen Widersprüchen führt und
daher unerwünscht ist.

Beispiel:

(1) Von einer Korrelationsmatrix

r123 1 2 3
1 1 0.45 -0.32
2 0.45 1 0.62
3 -0.32 0.62 1

mit folgenden Eigenwerten
1.640827957822510
1.297084722589220
0.062087319588269

in der Spaltenanordnung 123 werden die Hauptkomponentenladungen
berechnet (Matlab) wie folgt, eig sortiert:

(2) [V,D]=eig(r)
(3) F=V*sqrt(D)

mit folgenden Hauptkomponentenladungen:

F123: F1_123 F2_123 F3_123
1 -0.2818 -0.9512 0.1256
2 -0.9654 -0.2079 -0.1573
3 -0.7933 0.5908 0.1468

(4) Nun werden die Spalten und Zeilen der Korrelationsmatrix vertauscht,
z.B. wie folgt:

r132 1 3 2
1 1 -0.32 0.45
3 -0.32 1 0.62
2 0.45 0.62 1

mit den Eigenwerten
1.640827957822510
1.297084722589220
0.062087319588269

und erneut die Hauptkomponenten berechnet mit dem Ergebnis

F132: F1_132 F2_132 F3_132
1 0.2818 0.9512 -0.1256
3 0.7933 -0.5908 -0.1468
2 0.9654 0.2079 0.1573

Da àndern sich die Vorzeichen der Ladungen, was insofern fatal ist, weil
die Ladungen als Korrelationen der Hauptkomponenten mit der Variablen
interpretiert werden. Und bei Korrelationen ist das Vorzeichen natürlich
von grundlegender Bedeutung. Für die Varianzen spielt das keine Rolle,
weil die sich aus den Quadraten der Ladungen ergeben.

Zum leichteren Vergleich eine Gegenüberstellung von

F123: F1_123 F2_123 F3_123 F132: F1_132 F2_132 F3_132
1 -0.2818 -0.9512 0.1256 1 0.2818 0.9512 -0.1256
2 -0.9654 -0.2079 -0.1573 2 0.9654 0.2079 0.1573
3 -0.7933 0.5908 0.1468 3 0.7933 -0.5908 -0.1468

(zum leichteren Vergleich bei F132 Zeile 2 und 3 umsortiert)

Ergebnis: Durch permutieren der Zeilen und Spalten àndern sich zwar
nicht die Ladungsbetràge und hier auch nicht die Eigenwerte bis zur 15.
Nachkommastelle, aber die Vorzeichen.

Nach meinem Verstàndnis sollten die Hauptkomponenten auch bei
Permutation der Ausgangsmatrix gleich bleiben, also auch das Vorzeichen.
Das ist aber wie mein Beispiel zeigt nicht der Fall.

Fragen:
a) wie kann das erklàrt werden? Die Vorzeichen folgen den Vorzeichen der
Eigenvektoren. Soweit ist geklàrt, woher das rührt, aber nicht warum.
b) Gibt es eine Methode, die Vorzeichentreue zu gewàhrleisten?
c) Mathematische Bewertung.

Vielen Dank für klàrende Unterstützung.

Rudolf Sponsel, Erlangen
 

Lesen sie die antworten

#1 Ralf Bader
02/02/2014 - 00:39 | Warnen spam
Rudolf Sponsel wrote:

Nr.2 (Fragen veràndert)

Kurzfassung: Ändert man die Anordnung der Zeilen und Spalten einer
Korrelationsmatrix, können die Hauptkomponentenladungen ihr Vorzeichen
veràndern, was bei der Interpretation zu fatalen Widersprüchen führt und
daher unerwünscht ist.

Beispiel:

(1) Von einer Korrelationsmatrix

r123 1 2 3
1 1 0.45 -0.32
2 0.45 1 0.62
3 -0.32 0.62 1

mit folgenden Eigenwerten
1.640827957822510
1.297084722589220
0.062087319588269

in der Spaltenanordnung 123 werden die Hauptkomponentenladungen
berechnet (Matlab) wie folgt, eig sortiert:

(2) [V,D]=eig(r)
(3) F=V*sqrt(D)

mit folgenden Hauptkomponentenladungen:

F123: F1_123 F2_123 F3_123
1 -0.2818 -0.9512 0.1256
2 -0.9654 -0.2079 -0.1573
3 -0.7933 0.5908 0.1468

(4) Nun werden die Spalten und Zeilen der Korrelationsmatrix vertauscht,
z.B. wie folgt:

r132 1 3 2
1 1 -0.32 0.45
3 -0.32 1 0.62
2 0.45 0.62 1

mit den Eigenwerten
1.640827957822510
1.297084722589220
0.062087319588269

und erneut die Hauptkomponenten berechnet mit dem Ergebnis

F132: F1_132 F2_132 F3_132
1 0.2818 0.9512 -0.1256
3 0.7933 -0.5908 -0.1468
2 0.9654 0.2079 0.1573

Da àndern sich die Vorzeichen der Ladungen, was insofern fatal ist, weil
die Ladungen als Korrelationen der Hauptkomponenten mit der Variablen
interpretiert werden. Und bei Korrelationen ist das Vorzeichen natürlich
von grundlegender Bedeutung. Für die Varianzen spielt das keine Rolle,
weil die sich aus den Quadraten der Ladungen ergeben.

Zum leichteren Vergleich eine Gegenüberstellung von

F123: F1_123 F2_123 F3_123 F132: F1_132 F2_132 F3_132
1 -0.2818 -0.9512 0.1256 1 0.2818 0.9512 -0.1256
2 -0.9654 -0.2079 -0.1573 2 0.9654 0.2079 0.1573
3 -0.7933 0.5908 0.1468 3 0.7933 -0.5908 -0.1468

(zum leichteren Vergleich bei F132 Zeile 2 und 3 umsortiert)

Ergebnis: Durch permutieren der Zeilen und Spalten àndern sich zwar
nicht die Ladungsbetràge und hier auch nicht die Eigenwerte bis zur 15.
Nachkommastelle, aber die Vorzeichen.

Nach meinem Verstàndnis sollten die Hauptkomponenten auch bei
Permutation der Ausgangsmatrix gleich bleiben, also auch das Vorzeichen.
Das ist aber wie mein Beispiel zeigt nicht der Fall.

Fragen:
a) wie kann das erklàrt werden? Die Vorzeichen folgen den Vorzeichen der
Eigenvektoren. Soweit ist geklàrt, woher das rührt, aber nicht warum.
b) Gibt es eine Methode, die Vorzeichentreue zu gewàhrleisten?
c) Mathematische Bewertung.

Vielen Dank für klàrende Unterstützung.

Rudolf Sponsel, Erlangen



Ich habe keine Ahnung, was "Hauptkomponentenladungen" sein mögen, aber
vielleicht kriegt das Zeug das Vorzeichen der Permutation mit. Im Beispiel
-1, weil eine Transposition, für die Permutation 123 -> 231 wàre es
+1=(-1)^2, weil 2 Transpositionen. Nàheres cf. symmetrische/alternierende
Gruppe. Das Matlab kann ja mal entsprechende Beispiele rechnen.

Ähnliche fragen