통계1 IQR : Inter Quartile range, 사분범위 IQC : Inter Quartile range, 사분범위 전체 데이터들을 오름차순으로 정렬하고, 정확히 4등분(25%, 50%, 75%, 100%)으로 나눔. 여기서 75% 지점의 값과 25% 지점의 값의 차이를 IQR이라고 함. 전체 데이터의 50% 데이터가 몰려있는 구간 첨부예제에서는 25% 의 값 3.5, 75%의 값 8.5가 확인되며, 즉 IQR 은 8.5 - 3.5 = 5이다. df_test_iqr = pd.read_excel('test_iqr.xlsx') df_test_iqr.describe() 추가 : 일반적으로 이상치(outlier)는 IQR의 1.5배를 넘어서는 값을 이상치로 간주/처리한다 즉 여기에서는 1.5 x iqr = 7.5가 기준이 된다. 즉 75% 값 8.5보다 7.5가 큰 .. 2023. 3. 24. 이전 1 다음