문서 작업을 하거나 외부에서 받은 파일을 열었을 때, “�”, “æ”, “Ô, “한자?” 같은 이상한 문자들이 잔뜩 보이면 당황스럽죠.
이게 바로 텍스트 인코딩 깨짐 현상인데요. 간단한 실수 하나로 파일 전체가 읽을 수 없게 되는 경우도 있어서 골치 아픈 문제입니다.
이번 포스팅에서는 이 깨진 글자를 복구하는 방법을 알려드릴게요!
특히 제가 많이 쓰이는 두 가지 도구인 Localizely Text Encoding Converter와 뷁어번역기도 함께 소개해드리겠습니다.
1. 텍스트 인코딩 깨짐이란?
1) 인코딩이란?
인코딩이란 문자를 컴퓨터가 저장하고 읽을 수 있도록 숫자로 변환하는 방식입니다. 대표적으로는 UTF-8, EUC-KR, ANSI, ISO-8859-1 등이 있죠.
2) 왜 글자가 깨질까?
깨진 글자가 나오는 이유는 간단해요. 저장할 때 사용한 인코딩 방식과, 열 때 사용하는 인코딩 방식이 다르기 때문이에요. 예를 들어 EUC-KR로 저장된 파일을 UTF-8로 열면 “안녕하세요”가 “¾È³çÇϽÿÀ”처럼 깨져보일 수 있어요.
3) 주로 언제 발생할까?
- 외부에서 받은 텍스트 파일 열 때(특정 국가에서 만든 파일 설명서 or Readme.txt
- 다른 운영체제 간 파일을 주고받을 때 (예: Windows ↔ macOS)
- 오래된 시스템에서 생성한 CSV 파일 열 때
- 웹에서 크롤링한 데이터 처리 시
2. 깨진 글자를 자동으로 복구하기: Localizely Text Encoding Converter
1) 어떤 도구인가요?
Localizely Text Encoding Converter는 텍스트 파일을 업로드하면 깨진 글자를 분석해 어떤 인코딩 방식이 사용되었는지 자동으로 추정해주고,
사용자가 원하는 인코딩으로 바꿔주는 웹 서비스입니다.
2) 사용 방법
- 위 링크 접속
- 깨진 글자가 포함된 파일
(.txt
,.csv
) 업로드 - 자동으로 인코딩 추정 -> 예상 문자셋 알려줌
- 원하는 문자셋으로 변환 후 다운로드(일반적으로 UTF8이면 대부분 언어로 잘 나옴)
3) 장점
- 자동 인코딩 추정: 사용자가 인코딩 방식을 몰라도 문제없음
- 빠르고 간편한 웹 기반: 설치 필요 없음
- 여러 인코딩 포맷 지원: UTF-8, EUC-KR, ISO-8859-1 등 다양하게 지원
4) 유의사항
- 대용량 파일은 다소 느릴 수 있음
- 표 형식이 많거나 특수기호가 많은 경우 완벽하게 처리되지 않을 수도 있음(나름 잘됨)
3. 실시간 복구 & 커스터마이징: 뷁어번역기
1) 어떤 도구인가요?
뷁어번역기는 깨진 글자를 실시간으로 변환해볼 수 있는 사이트예요. Localizely와는 달리 파일을 업로드하지 않고,
텍스트를 직접 입력해서 어떤 인코딩인지 바꿔가며 바로 결과를 확인할 수 있어요.
2) 사용 방법
- 링크 접속
- 깨진 텍스트를 입력
- 인코딩 추정이 아니라, 내가 직접 인코딩 방식을 선택
- 변환된 결과를 실시간으로 확인하고 복사
3) 장점
- 실시간 확인 가능: 여러 인코딩을 시도해가며 바로바로 결과를 확인할 수 있음
- 정교한 제어: 내가 직접 인코딩 포맷을 지정하니 더 정확함
- 빠른 테스트용으로 적합
- 많은 글자는 안됨
4) 이런 경우에 좋아요!
- 복잡하지 않은 텍스트 복구
- 복구 결과를 비교해보고 싶을 때
- 어떤 인코딩인지 대강 알고 있는 경우
4. 복구 팁과 정리
1) 어떤 도구를 언제 써야 할까?
상황 | 추천 도구 |
---|---|
대량 텍스트 파일 자동 복구 | Localizely |
짧은 텍스트, 실시간 비교 | 뷁어번역기 |
2) 자주 사용하는 인코딩 조합
- “한글이 깨졌어요” → UTF-8로 열어봤다면 EUC-KR 또는 CP949를 시도해보세요
- “중국어나 특수문자가 깨졌어요” → GB2312 또는 Big5 확인
- CSV 파일 열었는데 칸이 안 맞아요 → ANSI (Windows-1252) 확인
3) VS Code, Sublime Text도 활용하세요!
코딩하시는 분들이라면 VS Code나 Sublime Text에서 “다른 인코딩으로 열기” 기능을 자주 쓰실 거예요. 이 방식도 빠르게 결과를 비교할 수 있는 좋은 방법입니다.
메모장 다른 이름으로 저장은… 잘 안되더라고요
5. 마무리, 깨진 글자, 당황하지 마세요!
처음엔 머리 아프고 짜증날 수 있지만, 알고 보면 텍스트 인코딩 문제는 충분히 해결할 수 있는 문제예요. 이번 포스팅에서 소개한 두 도구—Localizely Text Encoding Converter와 뷁어번역기—를 잘 활용하면 누구나 손쉽게 복구할 수 있습니다.
파일이 깨졌다고 너무 낙담하지 마시고, 침착하게 도구를 사용해보세요. 생각보다 훨씬 간단하게 문제를 해결할 수 있을 거예요!
혹시 텍스트 인코딩과 관련해서 더 궁금한 게 있다면 댓글로 남겨주세요. 함께 해결해드릴게요 🙂
*** 쿠팡 안전운전 추천템! ***
같이 보면 좋은 글
“이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.”