본문 바로가기
쫌쫌따리 통계+데이터+AI

비모수적 검정 방법

by stherhj 2022. 3. 20.

맨날 모수적 검정 방법만해서 비모수적 검정 방법? 그냥 식을 먼저 가정하고 모수를 찾자! 하는게 아니라 from scratch 한다..부호검정. .까지만 알았는데 이게 기출이라니~ 작년에 필기보고 바로 실기 못보는 구조라고 땅을 쳤는데 한 줄도 못쓰고 나와서 엉엉 울 뻔했눼..

 

비모수적 검정 방법 : 절대적 크기에 의존하지 않는 관측값들의 순위, 두 관측값 차이의 부호 등을 이용 


아래와 같은 상황에서 비모수적 검정 방법을 활용한다.

1) 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우. (e.g. 모집단의 정규성 or 집단간 등분산성 보장 불가)
2) 관측된 자료의 수가 30개 미만으로 적은 경우. (30개 이상의 표본->정규분포를 따르므로)

3) 자료가 개체간의 서열관계를 나타내는 경우.

https://sy-log.tistory.com/34

1. 부호검정(Sign Test) : 두 표본의 분포가 동일한지 검정. 관측치의 수치가 아닌 부호의 방향에 기반(그래서 약함 그치만 이상치에 민감X). 데이터의 분포 ~ 정규 분포 필요 X. 서로 다른 모집단 or 동일 모집단으로 부터 나온 2개의 표본 필요 (후자의 경우 짝지어진 샘플 e.g. before & after 이어야)

  • 주어진 분포에 대해 +/- 계산. 0인 경우 0으로 입력
  • 0으로 입력한 경우 제외 부호 개수 n개 (->샘플의 개수 중 유의한 샘플의 개수를 계산할 때 중위값과 같은 수치를 보이는 샘플의 개수를 제외한다.) x: 성공 횟수 p: 성공 확률 (부호검정에서는 성공 확률=실패 확률로 0.5)
  • H0, H1설정 후 유의수준과 p-value 확인

 

2. 윌콕슨의 순위합검정(Wilcoxon Rank Sum Test) : 독립적인 두 표본의 모집단의 중앙값 동일한지 검정(independent two sample t-test의 대안).

  • 두 표본의 결과를 오름차순으로 나열, 순위 부여
  • 순위 부여 시 결과가 같으면 해당 순위의 평균값을 동일하게 적용 ?
  • 표본 순위를 각각 합하여 이 순위 합과 표본의 개수를 활용하여 검정통계량 계산
  • H0, H1설정 후 유의수준과 p-value 확인
from scipy.stats import ranksums, mannwhitneyu

3. 윌콕슨의 부호순위합검정(Wilcoxon Signed-rank Test) : 짝지어진 두 표본의 중앙값 동일한지 검정(paired t-test의 대안)

두 표본의 값 차이의 부호와 절대값 확인. 0인값은 제외하고 샘플사이즈를 정의

  • 두 표본을 합쳐? 표본들의 값의 차이의 절대값을 오름차순으로 배열, 순위 부여
  • 각 + / - 부호의 순위하과 표본의 개수를 활용하여 검정통계량 계산
  • H0, H1설정 후 유의수준과 p-value 확인

 

 

from scipy.stats import wilcoxon

4. 만-위트니의 U검정
5. 런검정
6. 스피어만의 순위상관계수

-

http://contents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/13.pdf

 

댓글