파이썬

quantile() 함수

Br.Soo 2023. 3. 24. 23:11

1. 범위 확인

q1 = dataframe_name['column_name'].qualtile(0.25)  # 특정 column data에서 1사분위수, 즉 25%에 해당하는 값

q3 = dataframe_name['column_name'].qualtile(0.75)  # 75%에 해당하는 값

 

2. iqr 확인

## q3과 q1의 값 차이가 IQR range가 된다. 

iqr = q3 - q3

 

3. 이상치(outlier) 범위는 iqc의 1.5배 벗어난 것을 대부분 이상치(outlier)로 처리한다
outlier_range = 1.5 * iqr

q3 + outlier_range 

q1 - outlier_range

 

** 쉽게 정리

1) 1~100까지의 숫자가 있다.

2) 이 때 q1은 25, q3는 75

3) iqr = q3 - q1 = 75 - 25 = 50

4) outlier_range = 1.5 * 50 = 75

5) q3 + 75 = 75 + 75 = 150 => 즉 150 초과되는 값은 이상치로 간주

6) q1 - 75 = 25 - 75 = -50 => 즉 -50 미만인 값은 이상치로 간주 

(주의 : 데이터에 따라 추가 조건이 있을 수 있음. 예를 들어 시간의 경우는 data의 min 값이 0일 수도 있음)