본문 바로가기
쫌쫌따리 통계+데이터+AI

유의성 검정(Significance Test)

by stherhj 2022. 3. 20.

악 작년 이맘때 산업은행 빅데이터직무 셤 볼 때도 똑같이 공부하고 똑같이 오~아~했던 내용ㅠ_ㅠ 실화인가?

 

유의성 검정

통계치가 모수에 대한 예측과 다르게 나왔을 때, 1) 통계치가 우연임(H0) 2) 모수에 대한 예측이 틀림(H1)

 

 

단측검정(one-tailed test) : H1가 방향성(>,<)을 가짐

양측검정(two-tailed test) : 방향성 X (≠) α(유의 수준 p값의 비교 기준)의 값과 p-value를 양쪽으로 쪼개야 함.

 

1. Z-test

z-분포 이용 가설을 검정. 모집단의 평균과 표준편차을 알아야 함. 표본의 크기가 크거나 (n > 30) 모집단의 정규분포여야 함. 등분산 가정이 충족되어야 함.

1) 단일표본 z-test

e.g. 기존 A고등학교의 수학점수 평균은 70점, 표준편차는 15점인 정규분포. 올해 A고 100명 학생을 조사하였을 때 평균 85점. 올해의 점수와 이전의 점수의 평균이 같은지 유의수준(α) .05에서 검정.(->양측검정)

2) 독립표본(2표본) z-test

두 모집단을 비교할 경우 두 모집단의 분산이 같아야 함.

e.g. 전국 남녀 100명 무작위 남 평균 70kg, 표준편차 10kg 여 평균 50kg 표준편차 9kg 두 집단의 차이가 있는지 유의수준(α) .05에서 검정.

 

2. T-test

모집단의 분산을 모름. 종속변수가 연속형 양적변수. 데이터~정규분포 가정(이를 보장할 수 없을 때 3. 부호 검정과 같은 비모수 검정 활용).c.f. x가 이항변수가 아닌 3개 이상의 범주를 가지면 : ANOVA (그 x의 개수에 따라 일원 배치, 이원 배치 등으로 나뉨)

1) 단일표본 t-test

2) 독립표본 (2표본) t-test

등분산성가정

3) 종속표본 t-test

사전-사후 검사와 같이 두 집단간 종속관계가 있는 경우

 

3. 부호검정(비모수적 검정 방법)

데이터가 정규분포를 따른다고 가정할 수 없는 경우 (샘플이 작으면 알 수 없음).

댓글