Faktoranalyse basierend auf "Interaktionen"? (Beispiel auf den SGIPT-Seiten)

31/10/2014 - 11:22 von Gottfried Helms | Report spam
(Upps, separates doppelposting mit d.s.psy, ich hàtte es lieber als
*ein* posting mit beiden newsgroups im header. sigh...)

Ich habe mich mal wieder auf den Faktoranalyse-Seiten von
Rudolf (SGIPT: http://www.sgipt.org ) umgesehen und dort

http://www.sgipt.org/wisms/fa/Quader/q00.htm

ein merkwürdiges Beispiel gefunden, mit dem die Reproduktion
einer Korrelationsmatrix via Faktoranalyse illustriert werden
soll.

Es wird hier ein Beispiel verwendet, in dem auf der Basis
von 3 "unabhàngigen" Zufallsgrößen (also den impliziten
und aufzudeckenden Faktoren) 5 abhàngige Größen berechnet
worden sind, aus deren Korrelationsmatrix (in einer echten)
Faktoranalyse dann also die unabhàngigen Faktoren wieder
identifiziert/sichtbar gemacht werden sollen.
In diesem Beispiel geht es nun zwar lediglich darum, ein
Gefühl dafür zu bekommen, wie gut die Korrelationen reproduziert
werden, wenn ich nach der Faktoranalyse (genauer genommen PCA)
nur die 3 gefundenen relevanten Hauptkomponenten verwende
und außerdem in dieses System Fehlergrößen verschiedenen
Ausmaßes einstreue.

Das Beispiel als solches erscheint mir allerdings für die
Beschreibung der Vorgànge der FA/PCA etwas seltsam gewàhlt:
wàhrend die FA/PCA ja eigentlich dafür konzipiert ist, *additive*
Kompositionen aufzudecken, also z.B.
x1 = a1*f1 + b1*f2
x2 = a2*f1 + b2*f2
x3 = a3*f1 + b3*f2

wobei f1,f2 die unbekannten Werte der zugrundeliegenden Faktoren,
und x1,x2,x3,... die Werte der "empirisch" beobachteten, durch
die unbekannten Faktorenwerte zusammengesetzten, Variablen enthalten,
wird hier mit *multiplikativen* Kompositionen gearbeitet, z.B.

x1 = f1*f2
x2 = f1*f3
x3 = f2*f3
x4 = f1*f2*f3

wobei f1=lànge, f2=breite, f3 = Höhe

als Zufallswerte synthetisch erzeugt werden und in einer echten
Faktorenanalyse als Faktoren durch die Messungen von Volumen,
Oberflàche etc wiedergefunden werden sollen.

Eigentlich wird hier also die Faktorenanalyse auf das gestützt,
was wir in Regression und Anova-Modellen als "Interaktionsterme"
bezeichnen; diese Art von Modell für die FA/PCA, und insbesondere
die *vollstàndige* Modellierung durch diese Interaktionsterme
erscheint mir aber als sehr ungewöhnlich, jedenfalls habe ich in
allen meinen Arbeiten damit solche Modelle noch nie betrachtet.
Interaktionsterme sind zwar in der Regression und in der
Anova relativ gewöhnlich (z.B. in SPSS einfach zu modellieren),
aber als *Items* in der FA/PCA ? Das würde mich jetzt einmal
interessieren.

Hat jemand hier mehr Erfahrung damit ? (just curious!)


Gottfried


Ich habe mal neugierigerweise dieses Modell "linearisiert",
indem ich die berechneten Werte für die x1,x2,x3,... logarithmiert habe
und somit die Produkte in Summen (wie von der FA/PCA erwartet) verwandelt.

Da dies auch bedeutet, die Daten als Ratio-skaliert zu verstehen
(die Position des Nullpunkt ist *nicht* trivial) habe ich die Daten
dann auf den Nullpunkt zentriert indem ich einfach den Datensatz
verlàngert habe mit den jeweils negativen Werten der "Messungen"
in x1,x2, so daß für jede Variable der Mittelwert auf Null geht.

Mit solcherart transformierten Werten erhalte ich dann

* überraschenderweise sehr hohe Korrelationen der Items untereinander,

aber nichtsdestotrotz via multipler Regression

* eine perfekte Reproduktion der zugrundeliegenden Komposition
über die unstandardisierten beta-Gewichte

* Regressionsmodell (via PCA)
* Unstandardisierte beta-werte:

* Dependent items:
x1=Vol 1.000 1.000 1.000
x2=Ofl 0.799 0.740 0.993
x3=L*B 1.000 1.000 0.000
x4=L*H 1.000 0.000 1.000
x5=B*H 0.000 1.000 1.000
* Independent items:
f1=L 1.000 0.000 0.000
f2=B 0.000 1.000 0.000
f3=H 0.000 0.000 1.000


Aber dies nur am Rande.

Übrigens hat dann - als einzige- die Variable x2 (="Ofl") einen weiteren
(kleinen) Varianzanteil da hier die Logarithmierung
einer *Summe* 2*(f1*f2+f2*f3+...) eine zusàtzliche (wenn auch kleine)
Nichtlinearitàt hinzubringt.
 

Lesen sie die antworten

#1 Gottfried Helms
01/11/2014 - 02:39 | Warnen spam
Am 31.10.2014 11:22 schrieb Gottfried Helms:
(Upps, separates doppelposting mit d.s.psy, ich hàtte es lieber als
*ein* posting mit beiden newsgroups im header. sigh...)

Ich habe mich mal wieder auf den Faktoranalyse-Seiten von
Rudolf (SGIPT: http://www.sgipt.org ) umgesehen und dort

http://www.sgipt.org/wisms/fa/Quader/q00.htm

ein merkwürdiges Beispiel gefunden, mit dem die Reproduktion
einer Korrelationsmatrix via Faktoranalyse illustriert werden
soll.



Ich habe die Rechnungen versucht zu reproduzieren
und meine (tw. abweichenden) Ergebnisse in

http://go.helms-net.de/stat/fa/SGIPT_Quader.htm

dargestellt. Sie sind wahrscheinlich eine Verbesserung
der Original-Ergebnisse, da die auf SGIPT dokumentierten
Kennziffern (z.B. nichtmarginale negative Eigenwerte bei
einer Korrelationsmatrix) auf hohe numerische Rechen-
ungenauigkeiten hinweisen oder womöglich sogar Programmier-
fehler signalisieren.

Gottfried

Ähnliche fragen