-
문자형을 인트형로 바꾸는법 label encoder in pythondata-science-summary/summary 2020. 9. 19. 17:14반응형
<엔지니어는 구현을 못하면 모르는것이다>
label encoder
문자형을 인트형으로 변형해줌
문자형을 숫자형으로 LabelEncoder 를 통해 변형시킨뒤 이를 OneHotEncoder 로 하는것이 젤 정확할듯.from sklearn import preprocessing X = ["paris", "paris", "tokyo", "amsterdam"] le = preprocessing.LabelEncoder() le.fit(X) # 클래스 종류 le.classes_ le.transform(["paris", "paris", "tokyo", "amsterdam"]) le.inverse_transform([0, 0, 1, 2]) # 만약 두개의 컬럼을 조합하여 라벨링 하고 싶다면 import pandas as pd import numpy as np X1 = X X2 = X[::-1] X12 = np.array([X1,X2]).T.tolist() df = pd.DataFrame(X12, columns=['x1','x2']) temp = pd.DataFrame(df.groupby(['x1','x2']).count().index.values, columns=['x12']) df['con'] = le.fit_transform(temp.x12.astype('str')) df
반응형'data-science-summary > summary' 카테고리의 다른 글
variance 와 bias 관계 간단 정리 (0) 2020.09.19 분류 성능 측정하는법 Accuracy, Precision, Recall, F1 score, ROC, AUC in python (0) 2020.09.19 one-hot encoding 하는법 in python (0) 2020.09.19 Logistic regression 에서 통계적으로유의한 독립변수 찾는법 in python (0) 2020.09.19 로지스틱 회귀(logistic regression) in python (0) 2020.09.19