상세 컨텐츠

본문 제목

요인분석

SPSS

by Damon, Kim 2019. 9. 9. 15:40

본문

요인 분석(Factor Analysis)

요인 분석은 다수 변수들 간의 관계(상관관계)를 분석하여 변수들의 바탕을 이루는 공통차원들을 통해 변수를 설명하는 겁니다.

간격(등간)척도나 비율척도 대상을 분석하는 것으로 요인 분석을 실시하면 변수들에 대하여 복잡함을 줄이고 정보가 핵심 요인으로 묶이는 것이죠.

즉 다수 변수들의 정보손실을 최소화하면서 소수의 요인들로 압축하는 것입니다.

요인분석은 측정 도구의 타당성을 검증하기 위해 주로 이용됩니다.

요인분석을 위해서는 표본의 크기가 최소 50개 이상 되어야 하고, 100개 이상이 바람직합니다.

요인 추출에는 주성분분석과 공통요인분석 방법이 주로 이용됩니다.

주성분 분석 : 다수의 변수를 정보 손실을 최소화 하면서 하나 혹은 몇 개의 종합적 지표(주성분)로 요약하는 분석으로 변수의 차원을 축소하여 자료를 요약하는 것이 주 목적

공통요인 분석 : 원래 변수들의 토대가 되는 잠재차원들을 찾아내고, 분산의 구성에 대한 사전지식이 별로 없을때 사용

무슨 말인지 잘 모르고 알고 싶지도 않을 땐,,,,,,,

가장 널리 쓰이는 주성분 분석을 사용하면 되지요^^

그럼 주성분 분석을 이용하여 요인분석을 실시해보겠습니다.

예를 들어,

성격에 대한 설문조사 데이터가 있다고 가정하고, 독립변수에 해당하는 16개의 문항에 대한 측정도구를 요인분석해 보겠습니다.

변수는 해당 문항의 각 설문에 대한 전체를 설명하는 요인이고, 문항은 각 변수들의 개별 해당 질문 문항입니다.

 

변수(요인명)

문항

WS

WS1, WS2, WS3, WS4

CI

CI1, CI2,CI3, CI4

CC

CC1, CC2, CC3, CC4

TI

TI1, TI2, TI3, TI4

 

SPSS에서 분석 - 차원 축소 - 요인분석 클릭

새창에서 위 문항에 해당하는 16개의 변수 전체 클릭 - 변수로 이동 - 기술통계 - KMO와 Bartlett의 구형성 검증 - 계속 클릭

요인추출 클릭 - 방법(주성분분석 체크) - 추출(고정된 요인수 체크, 고정된 요인수 4 기입, 변수 4개가 이미 정해져 있으므로) - 계속 클릭

요인회전 클릭 - 베리맥스 체크 - 계속 클릭

옵션 클릭 - 크기순 정렬 체크 - 계속 클릭

SPSS 결과 값은 다음과 같습니다.

KMO와 Bartlett의 검정

표준형성 적절성의 Kaiser-Meyer-Olkin 측도.

.848

Bartlett의 구형성 검정

근사 카이제곱

1443.654

자유도

120

유의확률

.000

 

KMO(Karser Meyer Olkin)는 변수들 간의 상관성을 나타내는 척도로써, 전체 상관관계 행렬이 요인분석에 적합한지를 나타내는 지표입니다.

이 값이 0.6이상일 때 적합하고 좀 더 엄격할 경우 0.7까지도 보기도 하는데, 이보다 낮으면 변수들 간의 상관성이 별로 없어서 요인분석의 변수들로써 적당하지 못하다는 뜻입니다.

0.5를 최저 기준으로 보는 이론도 있지만 안전빵은 0.6이상~~~이 좋겠죠.

 

여기서는 0.848로 나와서 적합하다고 할 수 있습니다.

Bartlett의 구형성 검정은 상관관계 행렬상의 모든 상관관계 값들의 전반적 유의성을 나타내는 것으로 이 값이 유의적 (p<0.05)이면 요인분석 모형이 적합한 것입니다.

여기서는 유의확률이 0.000(p<.001)이라 적합하다고 할 수 있습니다.

 

공통성

 

초기

추출

WS1

1.000

.670

WS2

1.000

.718

WS3

1.000

.807

WS4

1.000

.626

CI1

1.000

.536

CI2

1.000

.861

CI3

1.000

.792

CI4

1.000

.392

CC1

1.000

.697

CC2

1.000

.539

CC3

1.000

.504

CC4

1.000

.620

TI1

1.000

.646

TI2

1.000

.651

TI3

1.000

.740

TI4

1.000

.695

추출 방법: 주성분 분석.

 

공통성은 추출된 요인들에 의해 각 변수가 얼마나 사용되는지를 나타내는 공통을 보여줍니다.

한 변수의 공통성은 그 변수의 분산이 추출된 요인들에 의해 설명되는 정도를 나타내고 0과 1사이의 값을 갖습니다.

공통성은 0.4 이상이면 (엄격하게 0.5 이상) 요인 분석 적합도가 좋다고 할 수 있습니다.

0.4 보다 낮게 나타난다면

그 변수를 무시하고 나머지 변수들을 중심으로 해석하는 방법,

그 변수를 제거하고 요인분석을 재실시 하는 방법이 있습니다.

연구자의 재량으로 선택하시면 되지만, 두번째 방법은 변수를 제거하더라도 연구목적에 별로 위배되지 않아야 해요.

여기서는 CI4가 0.4이하로 나타났습니다.

설명된 총분산

성분

초기 고유값

추출 제곱합 적재값

회전 제곱합 적재값

합계

% 분산

% 누적

합계

% 분산

% 누적

합계

% 분산

% 누적

1

6.132

38.327

38.327

6.132

38.327

38.327

3.009

18.804

18.804

2

2.161

13.504

51.832

2.161

13.504

51.832

2.771

17.321

36.125

3

1.136

7.100

58.931

1.136

7.100

58.931

2.587

16.168

52.293

4

1.065

6.656

65.588

1.065

6.656

65.588

2.127

13.294

65.588

5

.856

5.350

70.938

 

 

 

 

 

 

6

.764

4.773

75.711

 

 

 

 

 

 

7

.730

4.561

80.272

 

 

 

 

 

 

8

.590

3.685

83.958

 

 

 

 

 

 

9

.518

3.238

87.195

 

 

 

 

 

 

10

.443

2.770

89.965

 

 

 

 

 

 

11

.397

2.480

92.445

 

 

 

 

 

 

12

.337

2.105

94.550

 

 

 

 

 

 

13

.258

1.612

96.162

 

 

 

 

 

 

14

.235

1.469

97.631

 

 

 

 

 

 

15

.209

1.305

98.936

 

 

 

 

 

 

16

.170

1.064

100.000

 

 

 

 

 

 

설명된 총분산 결과표는 4개 요인이 16개 항목을 얼마나 잘 설명하는가를 나타냅니다.

16개 항목으로 구성된 것을 4개 요인으로 축소시킨 것이니까 설명력이 100%가 될 수 없어요.

회전 제곱한 적재값 중 합계는 아이겐값을, %분산은 공통분산을, %누적은 누적분산을 말합니다.

%누적(누적분산)은 추출된 요인들이 전체분산의 몇 %를 설명하는가를 나타내는 것인데 일반적으로 60%이상이면 요인의 설명력이 높다고 할 수 있습니다.

여기서는 65.588%로 나타났습니다.

성분행렬a

 

성분

1

2

3

4

WS3

.714

-.355

.407

-.076

CI3

.687

-.333

-.457

.014

WS2

.683

-.399

.161

-.259

TI4

.641

.504

-.123

-.126

TI3

.639

.527

-.064

-.224

CI2

.632

-.402

-.547

-.039

CI1

.625

-.323

-.158

.128

CC2

.616

-.021

-.025

.397

WS4

.610

-.331

.373

.071

CI4

.602

-.044

-.166

.023

WS1

.602

-.353

.246

-.350

TI2

.596

.495

.105

-.200

CC3

.596

.211

-.034

.321

CC4

.575

.442

-.074

.297

CC1

.540

.161

.382

.483

TI1

.517

.470

.023

-.398

요인추출 방법: 주성분 분석.

a. 추출된 4 성분

회전된 성분행렬a

 

성분

1

2

3

4

TI3

.818

.094

.152

.196

TI1

.785

.167

.039

.004

TI4

.763

.041

.211

.260

TI2

.751

.183

.015

.230

WS3

.121

.825

.191

.272

WS1

.197

.755

.244

-.044

WS2

.170

.741

.372

.039

WS4

.022

.692

.161

.347

CI2

.088

.221

.897

.035

CI3

.137

.252

.831

.140

CI1

.043

.358

.572

.280

CI4

.281

.231

.451

.239

CC1

.158

.279

-.060

.768

CC2

.129

.194

.358

.597

CC4

.491

-.064

.185

.583

CC3

.322

.082

.258

.572

요인추출 방법: 주성분 분석.

회전 방법: Kaiser 정규화가 있는 베리멕스.

a. 5 반복계산에서 요인회전이 수렴되었습니다.

 

이제 가장 중요하게 봐야 할 것으로 요인 적재값인데, 사전 연구에 맞게 분리되었는지 확인해야 합니다.

<성분행렬>은 회전하기 전의 결과이고, <회전된 성분행렬>은 회전한 후의 결과입니다.

성분행렬은 1번 요인의 요인 적재값이 크게 나타나는데 회전전이라서 그런 것이구요

중요한 회전된 성분행렬은 요인들이 번호별로 뚜렷하게 분리되는 것을 볼 수 있습니다.

요인 적재값은 0.4 이상이면 (엄격하게 0.5 이상)이면 해당 요인으로 분류합니다.

여기서는 TI요인들이 1번, WS요인들이 2번, CI요인들이 3번, CC요인들이 4번으로 0.4이상으로 묶였습니다.

만일 0.4 미만으로 나타났다면, <공통성>부분에서 0.4미만인 요인들을 제거하고 동일한 방법으로 다시 분석할 수 있습니다.

위 예에서 CI4가 <공통성>에서 .392로 나타났지만 <회전된 성분행렬>에서 큰 문제 없이 나타났기 때문에 저는 제거하지 않았습니다.

요인이 잘 묶이지 않을 때

<공통성>에서 0.4미만 요인 제거하고 다시 돌려보고

<회전된 성분행렬>에서 0.4미만이거나 요인들이 잘 묶이지 않을 때 묶여햐 할 변수끼리 묶이지 않고 엉뚱한 곳에 묶일 경우 해당 변수 제거하는 방식으로 하면 되는데 가급적 한개씩 제거하고 다시 돌려보는 방식을 권합니다.

참고로 <회전된 성분행렬>표 및에 베리맥스가 있어요.

우리가 분석전에 체크한 것 기억하시죠?

베리맥스는 요인행렬의 열의 분산 합계를 최대화함으로써 열(요인)을 단순화하는 방식으로 일반적으로 가장 많이 사용돼요.

 

 

논문에 기입해야 할 결과표도 작성해야지요?

 

 

 

1

2

3

4

TI3

.818

.094

.152

.196

TI1

.785

.167

.039

.004

TI4

.763

.041

.211

.260

TI2

.751

.183

.015

.230

WS3

.121

.825

.191

.272

WS1

.197

.755

.244

-.044

WS2

.170

.741

.372

.039

WS4

.022

.692

.161

.347

CI2

.088

.221

.897

.035

CI3

.137

.252

.831

.140

CI1

.043

.358

.572

.280

CI4

.281

.231

.451

.239

CC1

.158

.279

-.060

.768

CC2

.129

.194

.358

.597

CC4

.491

-.064

.185

.583

CC3

.322

.082

.258

.572

아이겐값

3.009

2.771

2.587

2.127

공통분산(%)

18.804

17.321

16.168

13.294

누적분선(%)

18.804

36.125

52.293

65.588

KMO = .848, Bartlett x2=1443.654, p<.001

 

 

아이겐 값, 공통분산, 누적분산은 <설명된총분산> 회전적재값의 수치들을 행열 바꿔서 기입하시면 되구요.

KMO, Bartlett의 구형성 검증, P값은 <KMO와 Bartlett의 검증>에 있는 수치들을 그대로 옮기시면 됩니다.

p값(유의확률)은 .000으로 나타났으니까 p<.001로 쓰셔야 합니다.

 

오늘도 일과 학업을 함께 하시는 파트타임 여러분들 퐈이팅 입니다.~~~!!

 

#요인분석 #탐색적요인분석 #박사논문 #석사논문 #학술논문 #SPSS #AMOS #구조방정식 #회귀분석 #논문통계 #통계분석 #데이터분석

 

'SPSS' 카테고리의 다른 글

카이스퀘어 검증(교차분석)  (0) 2019.09.10
신뢰도 분석  (0) 2019.09.09
빈도분석  (0) 2019.09.09
변수 계산  (0) 2019.09.05
자료의 코딩  (0) 2019.09.05

관련글 더보기