CPC949 인코딩을 UTF-8 변환
S.decode('cpc949').encode('utf-8')
위의 방식으로는 오류문자열을 처리할 수 없으므로
unicode(S, 'cpc949', errors='ignore').encode('utf-8')
'프로그래밍 > python' 카테고리의 다른 글
파이썬 한글 텍스트 마이닝 (KoNLPy) (0) | 2016.02.27 |
---|---|
UnicodeDecodeError: 'ascii' codec can't decode certain bytes (1) | 2010.09.24 |
파이썬에서 효율적인 문자열 붙이기 (1) | 2008.05.26 |