에러tlqkf!!!!!

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa6 in position 10: invalid start byte

소곡이 2023. 12. 12. 01:22
728x90


문제 상황

 csv 파일을 못 읽어옴.

import pandas as pd

dataPath = "./reviewData.xlsx"
data = pd.read_csv(dataPath)
data

 

 

에러

import pandas as pd

dataPath = "./reviewData.xlsx"
data = pd.read_csv(dataPath, encoding="euc-kr")
data

 

 한글 인코딩 세형제 다 했는데 안 되더라고요?

 

해결

 코드 보시면 알겠지만, csv가 아니라 xlsx를 사용했습니다. 

 

 csv의 c가 comma라는 의미래요. 즉, csv는 ,로 구분되는 텍스트 파일이지만, xlsx는 엑셀 수식까지 들어간 이진 파일이라는 말이죠. 

 

 그래서 xlsx를 csv로 변환해서 다시 하니까 됐습니다. 

 

 

https://convertio.co/kr/download/02c6e64747bf20aa5413ac1c218e93ddfcbcd7/

 

변환된 파일 — Convertio

전반적 변환 품질 평가 4.6 (21,487,288 표) 의견을 제공하려면 1 개 이상의 파일을 변환하여 다운로드해야합니다.!

convertio.co

 

 

 인코딩 건드렸는데 다 안 되면, 본인 파일이 csv가 아닌지 확인해보세요.