파이썬
quantile() 함수
Br.Soo
2023. 3. 24. 23:11
1. 범위 확인
q1 = dataframe_name['column_name'].qualtile(0.25) # 특정 column data에서 1사분위수, 즉 25%에 해당하는 값
q3 = dataframe_name['column_name'].qualtile(0.75) # 75%에 해당하는 값
2. iqr 확인
## q3과 q1의 값 차이가 IQR range가 된다.
iqr = q3 - q3
3. 이상치(outlier) 범위는 iqc의 1.5배 벗어난 것을 대부분 이상치(outlier)로 처리한다
outlier_range = 1.5 * iqr
q3 + outlier_range
q1 - outlier_range
** 쉽게 정리
1) 1~100까지의 숫자가 있다.
2) 이 때 q1은 25, q3는 75
3) iqr = q3 - q1 = 75 - 25 = 50
4) outlier_range = 1.5 * 50 = 75
5) q3 + 75 = 75 + 75 = 150 => 즉 150 초과되는 값은 이상치로 간주
6) q1 - 75 = 25 - 75 = -50 => 즉 -50 미만인 값은 이상치로 간주
(주의 : 데이터에 따라 추가 조건이 있을 수 있음. 예를 들어 시간의 경우는 data의 min 값이 0일 수도 있음)