본문 바로가기

파이썬8

describe() 메서드, info() 메서드 1. describe() 메서드 : DataFrame, Series에 적용 DataFrame_name.describe() : 적용 가능 DataFrame_name["column_name']. describe() : 적용 가능 2. info() 메서드 : dataframe에 적용 DataFrame_name.describe() : 적용 가능 DataFrame_name['column_name']. describe() : 적용 불가, 에러 발생 ** Series에 info() 메서드 적용시 하기와 같이 에러 발생 AttributeError: 'Series' object has no attribute 'info' 2023. 3. 26.
표준편차 확인 1. describe() 함수 사용 dataframe.describe() datafram['column'].describe() 2. std() 함수 사용 dataframe.std() dataframe['coumn'].std() 2023. 3. 24.
quantile() 함수 1. 범위 확인 q1 = dataframe_name['column_name'].qualtile(0.25) # 특정 column data에서 1사분위수, 즉 25%에 해당하는 값 q3 = dataframe_name['column_name'].qualtile(0.75) # 75%에 해당하는 값 2. iqr 확인 ## q3과 q1의 값 차이가 IQR range가 된다. iqr = q3 - q3 3. 이상치(outlier) 범위는 iqc의 1.5배 벗어난 것을 대부분 이상치(outlier)로 처리한다 outlier_range = 1.5 * iqr q3 + outlier_range q1 - outlier_range ** 쉽게 정리 1) 1~100까지의 숫자가 있다. 2) 이 때 q1은 25, q3는 75 3) i.. 2023. 3. 24.
특정조건의 값을 바꾸는 방법 1. 특정 조건에 해당하는 데이터 찾기 dataframe_name.loc[condition1] # condition1에 속하는 데이터만 보여줌, 예제에 의하면 특정 column에서 음수인 데이터만 보여줌 2. 특정 조건에 해당하는 데이터를 찾은 후 수정 condition1 = (datafram_name['column_name'] < 0 ) # 특정 column에서 음수인 데이터만 추출 dataframe_name.loc[condition1, 'column_name'] = np.nan # 음수를 모두 NaN이라는 missing value로 바꾸어 줌 3. 두 가지 특정 조건에 해당하는 데이터를 찾은 후 수정 datafram_name.loc[condition1 | condition2 , 'column_name.. 2023. 3. 24.