Zusammenfassung
Der Beitrag führt in die Grundlagen der Hauptkomponentenanalyse (PCA) und explorativen Faktorenanalyse (EFA) ein. Gemeinsam ist diesen Verfahren eine Reduktion von einer Menge von korrelierten Variablen auf wenige Komponenten mit den Zielen der Vereinfachung, der leichteren Interpretation und zur Darstellung von zugrunde liegenden latenten Variablen. Zunächst werden die mathematischen Grundlagen der PCA erörtert, bevor Kriterien zur Bestimmung der idealen Anzahl der Komponenten und Rotationsverfahren zur Vereinfachung der Interpretation vorgestellt werden. Anschließend werden zwei Anwendungsbeispiele aus der Politikwissenschaft diskutiert. Darauf folgend wird die PCA von der EFA abgegrenzt sowie die EFA als induktives Datenmodellierungsverfahren eingeführt. Abschließend erfolgt eine kommentierte Darstellung von Einführungswerken und weiterführender Literatur.
Für wertvolle Hinweise bei der Überarbeitung gilt Dank an Bernd Schlipphak. Für Hilfe bei der Erstellung und kritische Diskussion gilt mein Dank Achim Goerres und David Johann sowie den Hilfskräften Jakob Kemper, Sebastian Krause und Erik Wenker.
Notes
- 1.
- 2.
Ausnahme ist der eher hypothetische Fall perfekt korrelierter Variablen, hier erklärt bereits die erste Komponente die Gesamtvarianz.
- 3.
In den gängigen Statistikprogrammen (R, SPSS, Stata) geschieht dies automatisch durch die Verwendung der Korrelationsmatrix als Ausgangspunkt der PCA.
- 4.
Das folgende Beispiel geht auf Bartholomew et al. (2002, S. 116–120) zurück.
- 5.
Siehe für eine detaillierte Darstellung der mathematischen Grundlagen der Transformation Bortz und Schuster (2010, S. 397–400).
- 6.
Dabei stehen noch andere Berechnungsverfahren zur Verfügung: Für ordinale Variablen kann beispielsweise auch das Verfahren der polychorischen PCA bzw. EFA angewendet werden, das beispielsweise in Stata 14 über das Ado „polychoricpca“ verfügbar ist. Bei dichotomen Variablen kann auf die logistische PCA zurückgegriffen werden, die beispielsweise als Package für R zur Verfügung steht (Landgraf und Lee 2015).
- 7.
Dieser kann standardmäßig bei SPSS 22 über/PRINT=KMO angefordert werden, für Stata 14 ist das Ado „factortest“ verfügbar.
- 8.
Bartholomew et al. (2002, S. 167) verweisen darauf, dass bei einer PCA die erste Hauptkomponente immer die gleichen Ladungen aufweist, egal, wie viele Komponenten beibehalten werden, während dies bei einer Faktorenanalyse (siehe Abschn. 4) nicht der Fall ist. Daher solle die Rotation der Ladungen für eine PCA nicht vorgenommen werden, da diese mit einem Informationsverlust verbunden ist, während dies bei der EFA nicht zutrifft. Dennoch erscheint der Zugewinn durch die erleichterte Interpretation, die ja das Ziel der PCA ist, ausreichend, um eine Rotation der Komponenten durchzuführen, wie dies auch durch andere Autoren vorgeschlagen wird.
- 9.
Für die praktische Durchführung empfiehlt sich bei der PCA zuerst die Durchführung der orthogonalen Rotation. Anschließend werden die Komponenten interpretiert, indem sie benannt werden. Sollte nach der Benennung eine Korrelation der Komponenten wahrscheinlich erscheinen, sollte die Rotation erneut mit einem obliquen Verfahren durchgeführt werden, das dann angemessener wäre.
- 10.
Für eine weiterführende Darstellung wird auf Eid et al. (2015) verwiesen.
- 11.
Bei schiefwinkligen Rotationen kann der Nutzer in der Regel einen Wert p für die zulässige Höhe der Korrelationen zwischen den Komponenten angeben, der nach Empfehlung einiger Autoren (z. B. Lawley und Maxwell 1971) nicht über 4 liegen sollte, da die Komponenten sonst zu stark korreliert sind. Der Standardwert für das Promax-Verfahren ist bei SPSS p=4 und bei Stata p=3. Beim Promax-Verfahren erhält der Nutzer zuerst eine Struktur- und dann eine Mustermatrix, wobei letztere die eigentlich zu interpretierenden Komponentenladungen enthält.
- 12.
Dies erfolgt in Stata 14 mit dem Befehlt predict comp1 comp2, score.
- 13.
In manchen Statistikprogrammen, so beispielsweise Stata, erhält man statt der Kommunalität die Uniqueness (1 – Kommunalität) einer Variablen, also den Teil der Informationen der Indikatorvariablen, der nicht über die Faktoren dargestellt werden kann.
- 14.
Dabei werden beide Verfahren nicht selten vermischt, siehe beispielsweise Ray (2007), der eine PCA durchführt, aber mit EFA benennt.
- 15.
Die Berechnung verläuft dabei ähnlich wie bei der PCA, es wird jedoch eine Residualvariable berücksichtigt, siehe weiterführend Eid et al. (2015).
Literatur
Arminger, Gerhard. 1979. Faktorenanalyse. Stuttgart: Teubner.
Backhaus, Klaus, Bernd Erichson, Rolf Weiber, und Wulff Plinke, Hrsg. 2016. Faktorenanalyse. In Multivariate Analysemethoden, 385–452. Berlin/Heidelberg: Springer.
Bartholomew, David J., Fiona Steele, Irini Moustaki, und Jane I. Galbraith. 2002. The analysis and interpration of multivariate data for social scientists. Boca Raton: Chapman & Hall/CRC.
Bartlett, Maurice Stevenson. 1950. Tests of significance in factor analysis. British Journal of Statistical Psychology 3(2): 77–85. https://doi.org/10.1111/j.2044-8317.1950.tb00285.x.
Bortz, Jürgen, und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin/Heidelberg: Springer.
Cattell, R. B. 1966. The scree test for the number of factors. Multivariate Behavioral Research 1(2): 245–276. https://doi.org/10.1207/s15327906mbr0102_10.
Cleff, Thomas, Hrsg. 2015. Faktorenanalyse. In Deskriptive Statistik und Explorative Datenanalyse: Eine computergestützte Einführung mit Excel, SPSS und STATA, 217–234. Wiesbaden: Gabler Verlag.
Cureton, Edward E., und Ralph B. D‘Agostino. 2009. Factor analysis: An applied approach. New York: Psychology Press.
Dziuban, Charles D., und Edwin C. Shirkey. 1974. When is a correlation matrix appropriate for factor analysis? Some decision rules. Psychological Bulletin 81(6): 358.
Eid, Michael, Mario Gollwitzer, und Manfred Schmitt. 2015. Statistik und Forschungsmethoden: Mit Online-Materialien. 4., überarb. u. erw. Aufl. Weinheim/Basel: Beltz.
Eijk, Cees van der, und Jonathan Rose. 2015. „Risky business: Factor analysis of survey data – Assessing the probability of incorrect dimensionalisation.“ PloS one 10(3): e0118900. https://doi.org/10.1371/journal.pone.0118900.
Evans, Jocelyn A. J. 2000. „Contrasting attitudinal bases to Euroscepticism amongst the French electorate.“ Electoral Studies 19(4): 539–561. http://www.sciencedirect.com/science/article/pii/S0261379499000293. Zugegriffen am 04.08.2017.
Fabrigar, Leandre R., Duane T. Wegener, Robert C. MacCallum, und Erin J. Strahan. 1999. Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods 4(3): 272–299.
Field, Andy. 2013. Discovering statistics using IBM SPSS statistics: And sex and drugs and rock ,n‘ roll, 4. Aufl MobileStudy. Los Angeles/London/New Delhi: Sage.
Field, Andy, Jeremy Miles, und Zoë Field. 2013. Discovering statistics using R. Los Angeles: Sage. (Reprint).
Gabel, Matthew J., und John D. Huber. 2000. Putting parties in their place: Inferring party left-right ideological positions from party manifestos data. American Journal of Political Science 44(1): 94–103.
Hotelling, Harold. 1933. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology 24(6): 417–441.
Jackman, Robert W., und Ross A. Miller. 1996. A renaissance of political culture? American Journal of Political Science 40(3): 632–659. https://doi.org/10.2307/2111787.
Kaiser, H. F. 1958. The varimax criterion for analytic rotation in factor analysis. Psychometrica 23: 187–200.
Kaiser, H. F., und K. Dickman. 1959. Analytic determination of common factors. American Psychological Reports 14:425–438.
Kenny, Graham K. 1986. The metric properties of rating scales employed in evaluation research. Evaluation Review 10(3): 397–408. https://doi.org/10.1177/0193841X8601000309.
Kim, Jae-On, und Charles W. Mueller. 1978. Factor analysis. Statistical methods and pratical issues. Newbury Park: Sage.
Landgraf, Andrew J., und Yoonkyung Lee. 2015. Dimensionality reduction for binary data through the projection of natural parameters. arXiv:1510.06112.
Lawley, D. N., und A. E. Maxwell. 1971. Factor analysis as a statistical method, 2. Aufl. New York: American Elsevier Pub. Co.
Netjes, Catherine E., und Harmen A. Binnema. 2007. The salience of the European integration issue: Three data sources compared. Electoral Studies 26(1): 39–49. https://doi.org/10.1016/j.electstud.2006.04.007.
Pearson, Karl. 1901. On lines and planes of closest fit to systems of points in space. Philosophical Magazine 2:559–572.
Ray, Leonard. 2007. Validity of measured party positions on European integration: Assumptions, approaches, and a comparison of alternative measures. Electoral Studies 26(1): 11–22. https://doi.org/10.1016/j.electstud.2006.03.008.
Thurstone, Louis Leon. 1947. Multiple factor analysis. Chicago: University of Chicago Press.
Wolff, Hans-Georg, und Johann Bacher. 2010. Hauptkomponentenanalyse und explorative Faktorenanalyse. In Handbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof Wolf, 1. Aufl., 333–365. Wiesbaden: VS Verl. für Sozialwiss.
Verwendete Datensätze und Stata-Ados
Bischof, Daniel. 2017. New graphic schemes for stata: Plotplain & plottig. Stata Journal 17(3): 748–759.
GESIS. 2017a. Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2016. Version 2.1.0: GESIS Datenarchiv, Köln. https://doi.org/10.4232/1.12796.
GESIS. 2017b. GESIS Panel – Standard Edition. ZA5665 Data file Version 20.0.0: GESIS Datenarchiv, Köln. https://doi.org/10.4232/1.12766.
Rattinger, Hans, Sigrid Roßteutscher, Rüdiger Schmitt-Beck, Bernhard Weßels, Christof Wolf, Aiko Wagner, und Heiko Giebler. 2017. Post-election Cross Section (GLES 2013). Version 3.0.0: GESIS Data Archive, Cologne. https://doi.org/10.4232/1.12809.
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2018 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this entry
Cite this entry
Mayer, S.J. (2018). Hauptkomponentenanalyse und explorative Faktorenanalyse. In: Wagemann, C., Goerres, A., Siewert, M. (eds) Handbuch Methoden der Politikwissenschaft. Springer Reference Sozialwissenschaften. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-16937-4_31-1
Download citation
DOI: https://doi.org/10.1007/978-3-658-16937-4_31-1
Received:
Accepted:
Published:
Publisher Name: Springer VS, Wiesbaden
Print ISBN: 978-3-658-16937-4
Online ISBN: 978-3-658-16937-4
eBook Packages: Springer Referenz Sozialwissenschaften und Recht