아스키, EUC-KR(ASCII), UNICODE, UTF-8(UNICODE) 정의
Javascript 2012. 3. 6. 17:18
- ASCII:
1. 영문/숫자/기호 1글자는 1바이트, 한글/한자 1글자는 2바이트
2. 하나의 인코딩당, 영문과 또 다른 하나의 언어만 사용할 수 있습니다.
3. 하나의 파일에 여러 언어를 동시에 표현할 수 없습니다.
4. 컴퓨터 초창기부터 사용해 왔기에, 호환성이 좋습니다.
5. 웹페이지 작성에 사용 가능합니다.
- 한글 완성형 EUC-KR(ASCII) / ksc_c_5601-1987:
1. 영문/숫자/기호 1글자는 1바이트, 한글/한자 1글자는 2바이트
2. 영문, 한글, 한국에서 사용되는 한자만 표현. 즉, 특수 외국어 문자, 일본식/중국식
한자는 표현할 수 없습니다.
3. 하나의 파일에 여러 언어를 동시에 표현할 수 없습니다.
4. 컴퓨터 초창기부터 사용해 왔기에, 호환성이 좋습니다.
5. 웹페이지 작성에 사용 가능합니다.
- UNICODE:
1. 영문/숫자/기호/한글/한자 1글자는 2바이트, 파일에 저장시에도 2바이트
2. 모든 언어가 표현 가능합니다.
3. 하나의 파일에 모든 언어를 표현할 수 있습니다. 단 각 언어에 대한 폰트가 설치되어 있어야 가능합니다.
4. 유니코드의 역사가 그리 길지 않기 때문에 호환성이 떨어집니다.
5. 웹페이지를 작성할 수 없습니다.
6. 자바스크립트는 문자 집합은 UNICODE로 이루어져 있습니다.
- UTF-8(UNICODE):
1. 영문/숫자/기호 1글자는 1바이트, 한글/한자 1글자는 3바이트, 파일에 저장시에도 3바이트
2. 모든 언어가 표현 가능합니다.
3. 하나의 파일에 모든 언어를 표현할 수 있습니다. 단 각 언어에 대한 폰트가 설치되어 있어야 가능합니다.
4. 유니코드의 역사가 그리 길지 않기 때문에 호환성이 떨어집니다.
5. 웹페이지 작성에 사용 가능합니다.