단순 인덱싱으로 인하여

과도하게 매칭되어 검색 품질이 낮아지는 경우,

 

검색 랭킹 처리를 통해 검색 품질을 높여과는 과정을 검색 모델링이라고함

df.drop_duplicates(['열 명칭'])

 

엑셀 중복제거 처럼 특정 열을 지정하여, 데이터프레임 중복제거가 가능하다.

그런데 복수 열 중복제거 지정은 어떻게 하면 될까..?

df = pd.read_excel(expath, sheet_name="시트명")

 

참고로 엑셀은 csv등에 비해

로딩 시간이 길다.

 

+ Recent posts