pd.read_csv()

pd.read_csv()에서 인코딩 옵션

1
2
3
4
5
6
import pandas as pd

# 인코딩은 3종류가 있습니다. 인코딩 오류가 나면 3개 중 하나를 입력해보시면 됩니다.
df = pd.read_csv('/court_precedent.csv', encoding='euc-kr')
df = pd.read_csv('/court_precedent.csv', encoding='utf-8')
df = pd.read_csv('/court_precedent.csv', encoding='cp949')

pd.read_csv()에서 많이 사용되는 옵션 예시

1
2
3
4
5
6
7
8
9
10
# 맨 위의 값을 컬럼으로 안쓰고 행으로 사용할 경우, header = None
pd.read_csv('/court_precedent.csv', header = None)
# 맨 위의 이상한 행이 2개 이상일 경우 skiprows를 사용하면 된다.
pd.read_csv('/court_precedent.csv', skiprows = 2)


# 파일이 공백 2개나 3개 등으로 구분 되어있을 경우(정규 표현식 사용 가능)
pd.read_csv('/court_precedent.csv', sep ='\s+')
# 파일이 탭(공백 4칸)으로 구분되어있을 경우
pd.read_csv('/court_precedent.csv', sep ='/t')
Author

InhwanCho

Posted on

2022-11-22

Updated on

2022-11-22

Licensed under

Comments