https://stherhj.tistory.com/150?category=1052148
유의성 검정(Significance Test)
악 작년 이맘때 산업은행 빅데이터직무 셤 볼 때도 똑같이 공부하고 똑같이 오~아~했던 내용ㅠ_ㅠ 실화인가? 유의성 검정 통계치가 모수에 대한 예측과 다르게 나왔을 때, 1) 통계치가 우연임(H0)
stherhj.tistory.com
https://stherhj.tistory.com/159?category=1052148
T-TEST|ANOVA|상관분석
먼저 각 변수간의 등분산성을 확인한다. H0: 집단간의 분산이 동일하다. H1: 집단간의 분산이 동일하지 않다. p-value가 유의수준 0.05 보다 크면 귀무가설을 기각하지 못하여 등분산성 만족 var.test(Sa
stherhj.tistory.com
https://stherhj.tistory.com/185
신뢰구간(Confidence Interval)
신뢰구간: 샘플들을 통해 유추하는 '모수(모집단의 평균)가 실제로 포함될 것으로 예측되는 범위' 에 실제로 모수가 포함될 확률->신뢰수준 [ADP 24회] 5. 모집단의 평균 길이를 알아내기 위해 표본
stherhj.tistory.com
[?] z-test vs. t-test

both 모집단이 정규분포를 따른다. 독립표본의 경우 등분산성을 만족해야한다.(+여부를 몰라도 표본의 크기 30 이상으로 충분히 크다면 정규분포 활용)
diff. 모집단의 평균과 분산을 안다면, z-test, 모른다면, t-test
[!] 기출문제
24회 통계분석

→"모집단이 정규분포를 따른다는 가정이 존재하므로"가 아니라 "모집단의 분산을 알고 있으므로" z-test 시행.(모집단이 정규분포를 따르는건 t-test도 동일함.) 독립 표본 검정에 대해 등분산성이 보장되지 않을 때는 그냥..등분산성을 만족하지 않는다는 조건 하에 독립z검정을 수행. 이후 기각역 찾아서 비교(z test critical value 코드 결국 못찾은 이유: 알파벳 z에 집착해서 norm. distribution를 따른다는걸 까먹음..)

# Python program to find the z-value
# in a left-tailed test
# Importing the library
import scipy.stats
# Determine the z-critical value
scipy.stats.norm.ppf(.05)

→모집단에 대한 정규성을 가정하면 t-test로 신뢰구간을 구하고 그게 없으면..윌콕슨..? 윌콕슨씨도 신뢰구간을 구할 수가 있어..?

25회 통계분석


'쫌쫌따리 통계+데이터+AI' 카테고리의 다른 글
다시 정리하는 기출문제 (0) | 2022.09.18 |
---|---|
Google Cloud Certified - Professional Machine Learning Engineer (1) | 2022.09.09 |
시계열 분석(2) : 일보전진 이보후퇴 (0) | 2022.08.26 |
2. 제 3장 정형 데이터 마이닝 제 3절 군집분석 (1) | 2022.07.25 |
Tensorflow Developer Certificate (1) | 2022.07.08 |
댓글