맨날 모수적 검정 방법만해서 비모수적 검정 방법? 그냥 식을 먼저 가정하고 모수를 찾자! 하는게 아니라 from scratch 한다..부호검정. .까지만 알았는데 이게 기출이라니~ 작년에 필기보고 바로 실기 못보는 구조라고 땅을 쳤는데 한 줄도 못쓰고 나와서 엉엉 울 뻔했눼..
비모수적 검정 방법 : 절대적 크기에 의존하지 않는 관측값들의 순위, 두 관측값 차이의 부호 등을 이용
아래와 같은 상황에서 비모수적 검정 방법을 활용한다.
1) 관측된 자료가 특정분포를 따른다고 가정할 수 없는 경우. (e.g. 모집단의 정규성 or 집단간 등분산성 보장 불가)
2) 관측된 자료의 수가 30개 미만으로 적은 경우. (30개 이상의 표본->정규분포를 따르므로)
3) 자료가 개체간의 서열관계를 나타내는 경우.


1. 부호검정(Sign Test) : 두 표본의 분포가 동일한지 검정. 관측치의 수치가 아닌 부호의 방향에 기반(그래서 약함 그치만 이상치에 민감X). 데이터의 분포 ~ 정규 분포 필요 X. 서로 다른 모집단 or 동일 모집단으로 부터 나온 2개의 표본 필요 (후자의 경우 짝지어진 샘플 e.g. before & after 이어야)
- 주어진 분포에 대해 +/- 계산. 0인 경우 0으로 입력
- 0으로 입력한 경우 제외 부호 개수 n개 (->샘플의 개수 중 유의한 샘플의 개수를 계산할 때 중위값과 같은 수치를 보이는 샘플의 개수를 제외한다.) x: 성공 횟수 p: 성공 확률 (부호검정에서는 성공 확률=실패 확률로 0.5)
- H0, H1설정 후 유의수준과 p-value 확인
2. 윌콕슨의 순위합검정(Wilcoxon Rank Sum Test) : 독립적인 두 표본의 모집단의 중앙값 동일한지 검정(independent two sample t-test의 대안).
- 두 표본의 결과를 오름차순으로 나열, 순위 부여
- 순위 부여 시 결과가 같으면 해당 순위의 평균값을 동일하게 적용 ?
- 표본 순위를 각각 합하여 이 순위 합과 표본의 개수를 활용하여 검정통계량 계산
- H0, H1설정 후 유의수준과 p-value 확인
from scipy.stats import ranksums, mannwhitneyu
3. 윌콕슨의 부호순위합검정(Wilcoxon Signed-rank Test) : 짝지어진 두 표본의 중앙값 동일한지 검정(paired t-test의 대안)
두 표본의 값 차이의 부호와 절대값 확인. 0인값은 제외하고 샘플사이즈를 정의
- 두 표본을 합쳐? 표본들의 값의 차이의 절대값을 오름차순으로 배열, 순위 부여
- 각 + / - 부호의 순위하과 표본의 개수를 활용하여 검정통계량 계산
- H0, H1설정 후 유의수준과 p-value 확인
from scipy.stats import wilcoxon
4. 만-위트니의 U검정
5. 런검정
6. 스피어만의 순위상관계수
-
http://contents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/13.pdf
'쫌쫌따리 통계+데이터+AI' 카테고리의 다른 글
시계열 분석 (1) | 2022.03.24 |
---|---|
유의성 검정(Significance Test) (0) | 2022.03.20 |
데이터 처리 속도 측정 (코드 수행 시간 측정) (0) | 2022.03.20 |
Data Imbalance 이슈 해결 : 언더샘플링 & 오버샘플링 (0) | 2022.03.20 |
선형회귀 (0) | 2022.03.12 |
댓글