요인분석

SPSS

by Damon, Kim 2019. 9. 9. 15:40

요인 분석(Factor Analysis)

요인 분석은 다수 변수들 간의 관계(상관관계)를 분석하여 변수들의 바탕을 이루는 공통차원들을 통해 변수를 설명하는 겁니다.

간격(등간)척도나 비율척도 대상을 분석하는 것으로 요인 분석을 실시하면 변수들에 대하여 복잡함을 줄이고 정보가 핵심 요인으로 묶이는 것이죠.

즉 다수 변수들의 정보손실을 최소화하면서 소수의 요인들로 압축하는 것입니다.

요인분석은 측정 도구의 타당성을 검증하기 위해 주로 이용됩니다.

요인분석을 위해서는 표본의 크기가 최소 50개 이상 되어야 하고, 100개 이상이 바람직합니다.

요인 추출에는 주성분분석과 공통요인분석 방법이 주로 이용됩니다.

● 주성분 분석 : 다수의 변수를 정보 손실을 최소화 하면서 하나 혹은 몇 개의 종합적 지표(주성분)로 요약하는 분석으로 변수의 차원을 축소하여 자료를 요약하는 것이 주 목적

● 공통요인 분석 : 원래 변수들의 토대가 되는 잠재차원들을 찾아내고, 분산의 구성에 대한 사전지식이 별로 없을때 사용

무슨 말인지 잘 모르고 알고 싶지도 않을 땐,,,,,,,

가장 널리 쓰이는 주성분 분석을 사용하면 되지요^^

그럼 주성분 분석을 이용하여 요인분석을 실시해보겠습니다.

예를 들어,

성격에 대한 설문조사 데이터가 있다고 가정하고, 독립변수에 해당하는 16개의 문항에 대한 측정도구를 요인분석해 보겠습니다.

변수는 해당 문항의 각 설문에 대한 전체를 설명하는 요인이고, 문항은 각 변수들의 개별 해당 질문 문항입니다.

변수(요인명)	문항
WS	WS1, WS2, WS3, WS4
CI	CI1, CI2,CI3, CI4
CC	CC1, CC2, CC3, CC4
TI	TI1, TI2, TI3, TI4

SPSS에서 분석 - 차원 축소 - 요인분석 클릭

새창에서 위 문항에 해당하는 16개의 변수 전체 클릭 - 변수로 이동 - 기술통계 - KMO와 Bartlett의 구형성 검증 - 계속 클릭

요인추출 클릭 - 방법(주성분분석 체크) - 추출(고정된 요인수 체크, 고정된 요인수 4 기입, 변수 4개가 이미 정해져 있으므로) - 계속 클릭

요인회전 클릭 - 베리맥스 체크 - 계속 클릭

옵션 클릭 - 크기순 정렬 체크 - 계속 클릭

SPSS 결과 값은 다음과 같습니다.

KMO와 Bartlett의 검정
표준형성 적절성의 Kaiser-Meyer-Olkin 측도.		.848
Bartlett의 구형성 검정	근사 카이제곱	1443.654
	자유도	120
	유의확률	.000

KMO(Karser Meyer Olkin)는 변수들 간의 상관성을 나타내는 척도로써, 전체 상관관계 행렬이 요인분석에 적합한지를 나타내는 지표입니다.

이 값이 0.6이상일 때 적합하고 좀 더 엄격할 경우 0.7까지도 보기도 하는데, 이보다 낮으면 변수들 간의 상관성이 별로 없어서 요인분석의 변수들로써 적당하지 못하다는 뜻입니다.

0.5를 최저 기준으로 보는 이론도 있지만 안전빵은 0.6이상~~~이 좋겠죠.

여기서는 0.848로 나와서 적합하다고 할 수 있습니다.

Bartlett의 구형성 검정은 상관관계 행렬상의 모든 상관관계 값들의 전반적 유의성을 나타내는 것으로 이 값이 유의적 (p<0.05)이면 요인분석 모형이 적합한 것입니다.

여기서는 유의확률이 0.000(p<.001)이라 적합하다고 할 수 있습니다.

공통성
	초기	추출
WS1	1.000	.670
WS2	1.000	.718
WS3	1.000	.807
WS4	1.000	.626
CI1	1.000	.536
CI2	1.000	.861
CI3	1.000	.792
CI4	1.000	.392
CC1	1.000	.697
CC2	1.000	.539
CC3	1.000	.504
CC4	1.000	.620
TI1	1.000	.646
TI2	1.000	.651
TI3	1.000	.740
TI4	1.000	.695
추출 방법: 주성분 분석.

공통성은 추출된 요인들에 의해 각 변수가 얼마나 사용되는지를 나타내는 공통을 보여줍니다.

한 변수의 공통성은 그 변수의 분산이 추출된 요인들에 의해 설명되는 정도를 나타내고 0과 1사이의 값을 갖습니다.

공통성은 0.4 이상이면 (엄격하게 0.5 이상) 요인 분석 적합도가 좋다고 할 수 있습니다.

0.4 보다 낮게 나타난다면

그 변수를 무시하고 나머지 변수들을 중심으로 해석하는 방법,

그 변수를 제거하고 요인분석을 재실시 하는 방법이 있습니다.

연구자의 재량으로 선택하시면 되지만, 두번째 방법은 변수를 제거하더라도 연구목적에 별로 위배되지 않아야 해요.

여기서는 CI4가 0.4이하로 나타났습니다.

설명된 총분산
성분	초기 고유값			추출 제곱합 적재값			회전 제곱합 적재값
성분	합계	% 분산	% 누적	합계	% 분산	% 누적	합계	% 분산	% 누적
1	6.132	38.327	38.327	6.132	38.327	38.327	3.009	18.804	18.804
2	2.161	13.504	51.832	2.161	13.504	51.832	2.771	17.321	36.125
3	1.136	7.100	58.931	1.136	7.100	58.931	2.587	16.168	52.293
4	1.065	6.656	65.588	1.065	6.656	65.588	2.127	13.294	65.588
5	.856	5.350	70.938
6	.764	4.773	75.711
7	.730	4.561	80.272
8	.590	3.685	83.958
9	.518	3.238	87.195
10	.443	2.770	89.965
11	.397	2.480	92.445
12	.337	2.105	94.550
13	.258	1.612	96.162
14	.235	1.469	97.631
15	.209	1.305	98.936
16	.170	1.064	100.000

설명된 총분산 결과표는 4개 요인이 16개 항목을 얼마나 잘 설명하는가를 나타냅니다.

16개 항목으로 구성된 것을 4개 요인으로 축소시킨 것이니까 설명력이 100%가 될 수 없어요.

회전 제곱한 적재값 중 합계는 아이겐값을, %분산은 공통분산을, %누적은 누적분산을 말합니다.

%누적(누적분산)은 추출된 요인들이 전체분산의 몇 %를 설명하는가를 나타내는 것인데 일반적으로 60%이상이면 요인의 설명력이 높다고 할 수 있습니다.

여기서는 65.588%로 나타났습니다.

성분행렬a
	성분
	1	2	3	4
WS3	.714	-.355	.407	-.076
CI3	.687	-.333	-.457	.014
WS2	.683	-.399	.161	-.259
TI4	.641	.504	-.123	-.126
TI3	.639	.527	-.064	-.224
CI2	.632	-.402	-.547	-.039
CI1	.625	-.323	-.158	.128
CC2	.616	-.021	-.025	.397
WS4	.610	-.331	.373	.071
CI4	.602	-.044	-.166	.023
WS1	.602	-.353	.246	-.350
TI2	.596	.495	.105	-.200
CC3	.596	.211	-.034	.321
CC4	.575	.442	-.074	.297
CC1	.540	.161	.382	.483
TI1	.517	.470	.023	-.398
요인추출 방법: 주성분 분석.
a. 추출된 4 성분

회전된 성분행렬a
	성분
	1	2	3	4
TI3	.818	.094	.152	.196
TI1	.785	.167	.039	.004
TI4	.763	.041	.211	.260
TI2	.751	.183	.015	.230
WS3	.121	.825	.191	.272
WS1	.197	.755	.244	-.044
WS2	.170	.741	.372	.039
WS4	.022	.692	.161	.347
CI2	.088	.221	.897	.035
CI3	.137	.252	.831	.140
CI1	.043	.358	.572	.280
CI4	.281	.231	.451	.239
CC1	.158	.279	-.060	.768
CC2	.129	.194	.358	.597
CC4	.491	-.064	.185	.583
CC3	.322	.082	.258	.572
요인추출 방법: 주성분 분석. 회전 방법: Kaiser 정규화가 있는 베리멕스.
a. 5 반복계산에서 요인회전이 수렴되었습니다.

이제 가장 중요하게 봐야 할 것으로 요인 적재값인데, 사전 연구에 맞게 분리되었는지 확인해야 합니다.

<성분행렬>은 회전하기 전의 결과이고, <회전된 성분행렬>은 회전한 후의 결과입니다.

성분행렬은 1번 요인의 요인 적재값이 크게 나타나는데 회전전이라서 그런 것이구요

중요한 회전된 성분행렬은 요인들이 번호별로 뚜렷하게 분리되는 것을 볼 수 있습니다.

요인 적재값은 0.4 이상이면 (엄격하게 0.5 이상)이면 해당 요인으로 분류합니다.

여기서는 TI요인들이 1번, WS요인들이 2번, CI요인들이 3번, CC요인들이 4번으로 0.4이상으로 묶였습니다.

만일 0.4 미만으로 나타났다면, <공통성>부분에서 0.4미만인 요인들을 제거하고 동일한 방법으로 다시 분석할 수 있습니다.

위 예에서 CI4가 <공통성>에서 .392로 나타났지만 <회전된 성분행렬>에서 큰 문제 없이 나타났기 때문에 저는 제거하지 않았습니다.

요인이 잘 묶이지 않을 때

<공통성>에서 0.4미만 요인 제거하고 다시 돌려보고

<회전된 성분행렬>에서 0.4미만이거나 요인들이 잘 묶이지 않을 때 묶여햐 할 변수끼리 묶이지 않고 엉뚱한 곳에 묶일 경우 해당 변수 제거하는 방식으로 하면 되는데 가급적 한개씩 제거하고 다시 돌려보는 방식을 권합니다.

참고로 <회전된 성분행렬>표 및에 베리맥스가 있어요.

우리가 분석전에 체크한 것 기억하시죠?

베리맥스는 요인행렬의 열의 분산 합계를 최대화함으로써 열(요인)을 단순화하는 방식으로 일반적으로 가장 많이 사용돼요.

논문에 기입해야 할 결과표도 작성해야지요?

	1	2	3	4
TI3	.818	.094	.152	.196
TI1	.785	.167	.039	.004
TI4	.763	.041	.211	.260
TI2	.751	.183	.015	.230
WS3	.121	.825	.191	.272
WS1	.197	.755	.244	-.044
WS2	.170	.741	.372	.039
WS4	.022	.692	.161	.347
CI2	.088	.221	.897	.035
CI3	.137	.252	.831	.140
CI1	.043	.358	.572	.280
CI4	.281	.231	.451	.239
CC1	.158	.279	-.060	.768
CC2	.129	.194	.358	.597
CC4	.491	-.064	.185	.583
CC3	.322	.082	.258	.572
아이겐값	3.009	2.771	2.587	2.127
공통분산(%)	18.804	17.321	16.168	13.294
누적분선(%)	18.804	36.125	52.293	65.588
KMO = .848, Bartlett x2=1443.654, p<.001

아이겐 값, 공통분산, 누적분산은 <설명된총분산> 회전적재값의 수치들을 행열 바꿔서 기입하시면 되구요.

KMO, Bartlett의 구형성 검증, P값은 <KMO와 Bartlett의 검증>에 있는 수치들을 그대로 옮기시면 됩니다.

p값(유의확률)은 .000으로 나타났으니까 p<.001로 쓰셔야 합니다.

오늘도 일과 학업을 함께 하시는 파트타임 여러분들 퐈이팅 입니다.~~~!!

#요인분석 #탐색적요인분석 #박사논문 #석사논문 #학술논문 #SPSS #AMOS #구조방정식 #회귀분석 #논문통계 #통계분석 #데이터분석

'SPSS' 카테고리의 다른 글

카이스퀘어 검증(교차분석) (0)	2019.09.10
신뢰도 분석 (0)	2019.09.09
빈도분석 (0)	2019.09.09
변수 계산 (0)	2019.09.05
자료의 코딩 (0)	2019.09.05