유의성 검정(Significance Test)
악 작년 이맘때 산업은행 빅데이터직무 셤 볼 때도 똑같이 공부하고 똑같이 오~아~했던 내용ㅠ_ㅠ 실화인가?
유의성 검정
통계치가 모수에 대한 예측과 다르게 나왔을 때, 1) 통계치가 우연임(H0) 2) 모수에 대한 예측이 틀림(H1)
단측검정(one-tailed test) : H1가 방향성(>,<)을 가짐
양측검정(two-tailed test) : 방향성 X (≠) α(유의 수준 p값의 비교 기준)의 값과 p-value를 양쪽으로 쪼개야 함.
1. Z-test
z-분포 이용 가설을 검정. 모집단의 평균과 표준편차을 알아야 함. 표본의 크기가 크거나 (n > 30) 모집단의 정규분포여야 함. 등분산 가정이 충족되어야 함.
1) 단일표본 z-test
e.g. 기존 A고등학교의 수학점수 평균은 70점, 표준편차는 15점인 정규분포. 올해 A고 100명 학생을 조사하였을 때 평균 85점. 올해의 점수와 이전의 점수의 평균이 같은지 유의수준(α) .05에서 검정.(->양측검정)
2) 독립표본(2표본) z-test
두 모집단을 비교할 경우 두 모집단의 분산이 같아야 함.
e.g. 전국 남녀 100명 무작위 남 평균 70kg, 표준편차 10kg 여 평균 50kg 표준편차 9kg 두 집단의 차이가 있는지 유의수준(α) .05에서 검정.
2. T-test
모집단의 분산을 모름. 종속변수가 연속형 양적변수. 데이터~정규분포 가정(이를 보장할 수 없을 때 3. 부호 검정과 같은 비모수 검정 활용).c.f. x가 이항변수가 아닌 3개 이상의 범주를 가지면 : ANOVA (그 x의 개수에 따라 일원 배치, 이원 배치 등으로 나뉨)
1) 단일표본 t-test
2) 독립표본 (2표본) t-test
등분산성가정
3) 종속표본 t-test
사전-사후 검사와 같이 두 집단간 종속관계가 있는 경우
데이터가 정규분포를 따른다고 가정할 수 없는 경우 (샘플이 작으면 알 수 없음).