개인용 랩탑을 맥북으로 바꾸면서, 역시나 우려했던 윈도우와의 호환 문제가 발생했다. 맥을 쓰면 감수해야할 불편한 것들이 몇 가지 있다고는 알고 있었지만 막상 맞닥뜨리게 되니 앞으로 상당히 번거로울 것 같은 예감이 든다. 얼마전 공공데이터 포털(data.go.kr/)에서 강원도 춘천시 무료와이파이 정보 CSV 파일을 다운로드 받아서 엑셀로 열어보니 알아볼 수 없게 와장창 깨져있었다.



이렇게... 


윈도우에서는 잘 열리는 것을 보면 역시나 파일인코딩 문제인 것 같다(공공데이터 포털에 데이터를 업로드하신 분은 윈도우 유저?). 컬럼 이름도 제대로된 형식이 아니고 값들도 영문과 숫자를 제외하고는 일본어인지 뭔지 판별이 불가능... 혹시나하고 파일명을 간단히 바꾼 뒤(wifi.csv) Rstudio에서 그냥 불러와보았으나, 당연히 실패.



아주 다양한 시도를 해보았다. 깨진 CSV 파일 값들의 폰트도 바꿔보고, 텍스트 에디터에서도 불러와보고, TXT 텍스트 파일로 확장자 변환도 해보고... 생각보다 쉽게 해결될 줄 알았는데 생각보다 어려웠다. 일단 다운로드 받은 파일을 제대로 확인조차 못하니 막막할 따름이었다. 파일을 읽을 수 있게 Mac용으로 인코딩해서 읽어야했다.



* 엑셀에서 데이터 불러오기

한글이 깨지는 파일을 더블클릭으로 바로 열지 말고, 엑셀을 열어서 '데이터 - 외부 데이터 가져오기 - 텍스트에서'를 통해 파일을 가져온다. (공공데이터 포털에서 다운로드 받은 '강원도 춘천시 무료와이파이' 정보 데이터 가져오기)




데이터 가져오기를 누르면 바로 파일이 열리지 않고 텍스트 마법사 창이 하나 뜬다. 데이터를 그냥 가져오게 되면 역시나 깨지게 되지만 기존에 Macintosh로 되어있는 데이터 형식을 Korean(Mac OS)로 바꿔주면 오른쪽 이미지 '선택한 데이터 미리보기'에서 보이는 것처럼 한글이 제대로 보인다. '다음'을 눌러준다.




CSV 파일(Comma Seperated Value)이므로 구분 기호 중 쉼표에 체크해주고 '마침'을 통해 데이터를 열어주면 한글이 깨지지 않고 제대로 불러와진 것을 확인할 수 있다.



* 엑셀에서 데이터 내보내기



데이터를 제대로 불러왔다면 이제는 더이상 깨지지 않게 내보내는 작업이 남았다. 아주 간단하다. '다른이름으로 저장'을 할 때 파일 형식을 'CSV UTF-8'로 바꿔 적절한 경로에 적절한 이름으로 저장해주면 된다. Rstudio에서 다시 불러와 보면 아래 이미지처럼 성공적으로 읽어지는 걸 볼 수 있다. 




이 파일을 다시 윈도우 엑셀에서 읽으면 깨지지는 않는데 윈도우 Rstudio에서 불러오려면 다시 한 번 인코딩 작업이 필요한 것 같다. (아니면 추가적인 옵션이 필요...) 언젠간 OS 간의 파일인코딩이 필요없어지는 날이 오길 바라며...



BELATED ARTICLES

more