이 글의 문맥을 분석하여 이글루스에 있는 많은 글 중에서 관련성이 높은 글을 자동으로 검색해 낸 결과입니다.
디버그 세상 debug.egloos.com
이글루스 로그인
뭐야이거... 몰라 무서워...
by 인명재천

카테고리
잡다한 이야기
프로그래밍&공부
Magic: the Gathering
마비노기
이미지링크용
이글루링크
미친병아리가 삐약삐약
소스코드위를 걷다.....
JeJenan's Magic the..
강철의 연금관리공단
Alphageek
◎ Yellow berry
幽雅に笑かせ, 墨染の櫻.
룰루아빠의 손가락
슈나의 망상 몽상 공상 일상
Trouble n Travel
Ri.E' Castle In The Mist
메롱쟁이
타이거팀
Robbie : 기록을 남기는..
bobab
Virgin Lunar
달빛바람이 머무는곳
. _ Emperor С. Д...
A day in the game d..
E m i l y
Dimmi
Links...
jin.wo.to
랜덤링크
새 블로그
즐겨찾기


라이프로그
링크
링크

최근 등록된 덧글
최근 포스팅에 인명재천..
by 윤소정 at 05/12
크아 애들 봐라.
by Kasca at 04/17
애들이 최고 귀여움 ㅎ ..
by Kasca at 04/17
마비친구분인가? 재천님..
by Mystic at 02/07
뭔진 모르겠고, 역시 ..
by Kasca at 01/30
최근 등록된 트랙백
Adderall.
by Adderall overnight no..
Amoxicillin and strep..
by Amoxicillin and clavu..
Levitra.
by Generic levitra.
Vicodin.
by Order vicodin es gene..
Adderall.
by Combining adderall ..
이글루 파인더
Powered by egloos
rss

skin by 이글루스
UTF-8과 UCS-2

요즘(2007년 현재) 유저 레벨의 유니코드 문서들은 상당수가 UTF-8 이다.
한편 UCS-2 인코딩도 은근히 많이 쓰이고 있는데,
다른 특징도 많이 있지만, 이 두가지만 비교해 보려고 한다.

 ==== UTF-8 ====
1. 가변길이
 - 1~6byte의 가변길이. 영어는 대개 1byte, 한중일 언어는 대부분 3byte
2. ASCII와의 호환성
 - ASCII로 작성된 모든 문서는 별도의 변환 없이 UTF-8로 변환 가능.
 - UTF-8로 작성된 모든 영문 문서도 ASCII 리더로도 별도의 변환없이 읽을 수 있음.
 - 따라서 영어권 국가에서 매우 대중적으로 사용.
3. 1바이트 단위의 패턴 매칭에 적합하다. 글자의 시작 바이트와 따라오는 바이트가 명확히 구분된다.
4. C언어에서 char * 를 사용해야 한다. 문자열길이와 관련된 함수들은 유니코드용 함수들을 써야 한다.
5. 유저 레벨의 유니코드 문서, 특히 웹과 리눅스를 중심으로 매우 광범위하게 사용되고 있다.


 ==== UCS-2 ====
1. 고정길이
 - 무조건 글자당 2byte. 프로그래밍 하기에 편하다. 특히 언어처리 등에서 쓰기 편하다.
2. 주로 MS 관련되어 많이 쓰인다. (WinAPI에서 char *를 받아도 내부적으로 UCS-2로 변환하여 사용한다고 한다)
3. char * 을 사용할때 널문자 문제가 생긴다. (wchar_t등을 사용해야 함. 참고로 gcc에서 wchar_t는 UCS-4 포맷이니 주의)
4. 1바이트 단위의 패턴 매칭에 어려움이 많다.

# by 인명재천 | 2007/10/09 15:14 | 트랙백
트랙백 주소 : http://debug.egloos.com/tb/3428294
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
※ 로그인 사용자만 덧글을 남길 수 있습니다.
이전페이지 다음페이지


이글루링크 추가하기
()을(를)
이글루링크로 추가하시겠습니까? 추가하시려면 그룹선택을 하세요.
(그룹선택 하지 않는 경우, 최상단 목록에 추가됩니다.)
그룹선택 :
이글루링크 취소