전체 글27 표준편차 확인 1. describe() 함수 사용 dataframe.describe() datafram['column'].describe() 2. std() 함수 사용 dataframe.std() dataframe['coumn'].std() 2023. 3. 24. quantile() 함수 1. 범위 확인 q1 = dataframe_name['column_name'].qualtile(0.25) # 특정 column data에서 1사분위수, 즉 25%에 해당하는 값 q3 = dataframe_name['column_name'].qualtile(0.75) # 75%에 해당하는 값 2. iqr 확인 ## q3과 q1의 값 차이가 IQR range가 된다. iqr = q3 - q3 3. 이상치(outlier) 범위는 iqc의 1.5배 벗어난 것을 대부분 이상치(outlier)로 처리한다 outlier_range = 1.5 * iqr q3 + outlier_range q1 - outlier_range ** 쉽게 정리 1) 1~100까지의 숫자가 있다. 2) 이 때 q1은 25, q3는 75 3) i.. 2023. 3. 24. 특정조건의 값을 바꾸는 방법 1. 특정 조건에 해당하는 데이터 찾기 dataframe_name.loc[condition1] # condition1에 속하는 데이터만 보여줌, 예제에 의하면 특정 column에서 음수인 데이터만 보여줌 2. 특정 조건에 해당하는 데이터를 찾은 후 수정 condition1 = (datafram_name['column_name'] < 0 ) # 특정 column에서 음수인 데이터만 추출 dataframe_name.loc[condition1, 'column_name'] = np.nan # 음수를 모두 NaN이라는 missing value로 바꾸어 줌 3. 두 가지 특정 조건에 해당하는 데이터를 찾은 후 수정 datafram_name.loc[condition1 | condition2 , 'column_name.. 2023. 3. 24. 조건부 loc 함수 condition = dataframe_name['column_name'] < 0 # 특정 column의 data에서 음수인 조건 지정 dataframe_name[condition] # 지정된 condition(조건)에 부합하는 데이터만 확인 가능함 2023. 3. 24. 이전 1 2 3 4 5 ··· 7 다음