본문 바로가기

IT/Tips

유니코드(Unicode) 값을 UTF로 변환하기

/* 
written by kaspy (kaspyx@gmail.com)
*/ 


ASCII 코드 테이블은 찾기 쉬운편인데 유니코드(Unicode) 테이블은 범위도 크고 찾기도 어려운것같다.


유니코드는 UCS-2와 UCS-4가 있는데 각각 2바이트 4바이트 크기를 가진다.


세계 모든 언어에 대한 문자를 저장하고 있고 찾아볼수있다.


바로 이 사이트이다 => http://unicode-table.com/en/


유니코드 변환을 해보자


사이트에 접속해서 검색창에 원하는 문자에대한 유니코드(Unicode) 인코딩 값을 얻을수있다.





예를들어 "닭" 이라는 문자에 대한 유니코드 인코딩 값을 찾아보겠다.



한글 "닭"에 대한 유니코드에 값은 U+B2ED이다.그냥 십육진수로 0xB2ED 라고 보면된다.


더불어서 HTML 코드 정보도 볼수 있다.


또한 각 UTF 인코딩 타입별 변환된 값을 볼수있다



"닭"이라는 한글을 UTF8로 인코딩하면 0xEB8BAD 라는 값을 가진다.


더불어서 BMP (Basic Multilingual Plane, 기본 다언어면) 정보 범위별로 값을 볼수도 있다.


(유니코드와 반드시 1:1 매칭 되진 않는다는것을 참고)