-
R에서 사분위수 또는 백분위수 구하는 법R/정리 2018. 11. 12. 23:29반응형
사분위수 구하는법
사분위수란 측정한 값을 4등분 했을 때 각 등위에 해당하는 것을 말하며
1/4분위수(25% quantile), 2/4분위수(50% quantile),
3/4분위수(75% quantile), 4/4분위수(100% quantile) 4가지로 나뉜다.
이를 R에서 확인하려면 quantile() 함수를 사용한다. 아래와 같은 코드를 실행시키면
> temp = c(1,2,3,4,5)
> quantile(temp)
0% 25% 50% 75% 100%
1 2 3 4 5
와 같은 식이 나온다.
하지만 독특한 점은 정확히 등분이 되지 않을때는 값을 한번 더 계산하여 구한다는것이다.
예를 들면 (1,2,3,4,5,6)
과 같이 정확히 중앙값이 나오지 않을 때에는
가운데 있는 3과 4의 평균 값인 3.5 가 50% quantile 이 되며,
25% quantile 은 반으로 쪼갰을 때 왼편의 중앙값, 즉 2 에 다음숫자와의 차에서 0.25를 곱한값으로 구한다.
ex) 2+ (3-2)*0.25 를 한 2.25 가 25% quantile
75% quantile 은 반으로 쪼갰을 때 오른 편의 중앙값에서 한칸 왼쪽의 숫자, 즉 4 에 다음숫자와의 차에서 0.75를 곱한값으로 구한다.
ex) 4+ (4-3)*0.75 를 한 4.75 가 75% quantile
아래와 같이 입력하여 확인 할 수 있다.
> temp2 = c(1,2,3,4,5,6)
>quantile(temp2)
0% 25% 50% 75% 100%
1.00 2.25 3.50 4.75 6.00
백분위수 구하는 법
그리고 30% quantile 이나 70% quantile 을 구하고 싶다면 quantile 함수 속에 prob = c(원하는 확률) 을
아래와 같은 식으로 입력하면된다.
> temp3 = c(1,2,3,4,5)
> quantile(temp3, prob=c(0.3, 0.7))
30% 70%
2.2 3.8
반응형