본문 바로가기
쫌쫌따리 통계+데이터+AI

비모수검정 Run-test (배열의 임의성을 판단)

by stherhj 2022. 6. 17.

https://sy-log.tistory.com/34

 

비모수적 검정방법 중 일련의 연속적 관측값이 임의적으로 나타난 것인지 검정하는 방법(관측값들이 얻어진 순서에 근거)

런: 한 종류의 부호가 시작~끝 한 덩어리

런의 수가 (시계열의 전체 길이 대비) 매우 많거나(음의 계열 상관) or 매우 적으면(양의 계열상관) 연관성이 있다고 한다.

계열상관: 원자료의 계열과 일정한 시간 차이를 갖는 계열간의 상관관계

 

예: 주식의 가격이 오르는 날에는 +, 내릴때는 

A주식 : +++ ------++++----+++--++++...

   + : 14, - : 12, 런의 갯수 : 7개 (양의 계열상관)

B주식 : +-+--+-+-+-+-+--+-+-++-++-+...

   + : 14, - : 13, 런의 개수 : 23개 (음의 계열상관)

 

양의 계열상관을 검정하기 위해서는 하한임계치를 사용하고,

음의 계열상관을 검정하기 위해서는 상한 임계치를 사용

계열상관의 존재 여부를 위해서는 양쪽 임계치 모두를 사용.

 

H0 : 연속적인 관측값이 임의적이다. (표본이 무작위로 추출되었다.)

H1 : 연속적인 관측값이 임의적이 아니다​.

library(snpar)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Approximate runs rest

data:  data
Runs = 5, p-value = 0.5023
alternative hypothesis: two.sided

###############
library(randtests)

#create dataset
data <- c(12, 16, 16, 15, 14, 18, 19, 21, 13, 13)

#perform Run's test
runs.test(data)

	Runs Test

data:  data
statistic = -0.67082, runs = 5, n1 = 5, n2 = 5, n = 10, p-value =
0.5023
alternative hypothesis: nonrandomness

-

참고(손으로 푸는 방법 포함)

https://blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=li0224il&logNo=220722414973

댓글