범주화(카테고리화) - pd.cut(), pd.qcut()
cut, qcut은 수치형 데이터를 카테고리화 하는 함수입니다.
pd.cut()
- pd.cut()은 구간(bin, 나누는 개수)을 특정 범위로 설정 가능합니다.
1 | df = pd.DataFrame({'Age' : range(1,100,7)}) |
pd.qcut()
- qcut은 cut과 달리 구간 설정을 정확히 나눌 경우 사용되어 임의의 계산이 필요 없다.
- 아래와 같은 경우 라벨이 young은 df[‘Age’].quantile(0.33)이하의 값이고 medium은 0.33 ~ 0.66이며, older는 df[‘Age’].quantile(0.66)의 값이 bin이다.
1 | df = pd.DataFrame({'Age' : range(1,100,7)}) |
범주화(카테고리화) - pd.cut(), pd.qcut()
http://inhwancho.github.io/2022/11/25/Study_folder/Pandas, Numpy/2022-11-25-cut()-qcut()/