Posted 2022-11-20Updated 2022-11-20Samplesa minute read (About 205 words)0 visits

Sample_codes

parquet(메모리 줄여줌)

import gc
def csv_to_parquet(csv_path, save_name):
    df = pd.read_csv(csv_path)
    df.to_parquet(f'./{save_name}.parquet')
    # df.to_parquet('train.parquet', engine='fastparquet', compression='snappy')
    del df
    gc.collect()
    print(save_name, 'Done.')
csv_to_parquet('./train.csv', 'train')
train = pd.read_parquet('./train.parquet').drop('road_in_use',axis=1)

# from google.colab import files 코랩인 경우
# files.download("train.parquet")

`query함수` (필터거는 함수) 열이름 입력

1	train.query('month==7 and year==2022 and day>15')

Labelencoding(train과 test데이터의 값이 다를 경우)

for i in str_col:
    le = LabelEncoder()
    le=le.fit(train[i])
    train[i]=le.transform(train[i])
    
    for label in np.unique(test[i]):
        if label not in le.classes_: 
            le.classes_ = np.append(le.classes_, label)
            #np.append하면 값이 추가되어 추가된 값이 라벨클래스에 추가되어 라벨링되는 구조
    test[i]=le.transform(test[i])

global 변수명 생성

1	globals()['data_{}'.format(i)]

Sample_codes

http://inhwancho.github.io/2022/11/20/Personal_folder/2022-11-20-sample-codes/

Author

InhwanCho

Posted on

2022-11-20

Updated on

2022-11-20

Licensed under

#samples

Sample_codes

Sample_codes

parquet(메모리 줄여줌)

`query함수` (필터거는 함수) 열이름 입력

Labelencoding(train과 test데이터의 값이 다를 경우)

global 변수명 생성

Author

Posted on

Updated on

Licensed under

Comments

Categories

Recents

Archives

Subscribe for updates

Sample_codes

Sample_codes

parquet(메모리 줄여줌)

query함수 (필터거는 함수) 열이름 입력

Labelencoding(train과 test데이터의 값이 다를 경우)

global 변수명 생성

Author

Posted on

Updated on

Licensed under

Comments

Categories

Recents

Archives

Subscribe for updates

`query함수` (필터거는 함수) 열이름 입력