sitelink1 https://ko.wikipedia.org/wiki/UTF-16 
sitelink2  
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

UTF-16 - 위키백과, 우리 모두의 백과사전

UTF-16(16-bit Unicode Transformation Format)은 유니코드 문자 인코딩 방식의 하나이다. 주로 사용되는 기본 다국어 평면 (BMP, Basic multilingual plane)에 속하는 문자들은 그대로 16비트 값으로 인코딩이 되고 그 이상의 문자는 특별히 정해진 방식으로 32비트로 인코딩이 된다.

UTF-16은 유니코드 컨소시엄과 ISO/IEC 10646에 의해 정의되어 있다. 유니코드는 거기에 추가적인 내용을 정하고 있다. 정확한 차이점은 유니코드 4.0 표준의 부록편 C 부분이 자세히 기술되어 있다. ISO 표준은 UCS-2 인코딩도 정의하며 여기선 BMP의 16비트 표현만을 다룬다.

기본 다국어 평면은 U+0000 에서 U+FFFF 에 놓인 문자를 담고 있다. 이 영역에는 우리가 쉽게 생각할 수 있는 문자들이 포함되며, 한글, 한자 등은 모두 여기에 포함되어 있다. 이 영역에는 서러게이트 문자(surrogate)들이 준비되어 있어 16비트 이상의 문자를 표현할 때를 대비해 놓았다.

기본 다국어 평면의 문자들은 곧바로 16비트 값으로 대응되어 인코딩되며, 이 경우에는 인코딩된 바이트 스트링의 엔디언만 조심하면 된다.

번호 제목 글쓴이 날짜 조회 수
공지 2023 Software Development Trend 정리 황제낙엽 2024.01.19 1
60 REST API 제대로 알고 사용하기 황제낙엽 2021.06.02 21
59 locale (로캘, 로케일) 황제낙엽 2021.03.19 15
58 [REST API] HTTP METHOD 종류 황제낙엽 2021.01.14 30
57 [Deno] TypeScript를 실행하기 위한 Command-line 런타임 황제낙엽 2021.01.14 8
56 어린이, 청소년용 프로그램 입문 황제낙엽 2017.05.03 69
55 컴퓨터는 음수를 2의 보수법으로 표현한다 file 황제낙엽 2016.10.24 753
54 변수를 unsigned int형 선언 0xffffffff 할당 결과가 -1이 되는 이유는? 황제낙엽 2016.10.24 376
53 0xFFFFFFFF의 값은 왜 -1인가? 황제낙엽 2016.10.24 177
52 unsigned와 signed 황제낙엽 2016.10.24 81
51 컴퓨터와 인간의 대화[20]-전각 문자와 반각 문자 황제낙엽 2016.04.22 122
50 컴퓨터와 인간의 대화[19]-인텔 HEX 황제낙엽 2016.04.22 28
49 컴퓨터와 인간의 대화[18]-베이스64 황제낙엽 2016.04.22 30
48 컴퓨터와 인간의 대화[17]-Surrogate Pair, Supplementary Characters file 황제낙엽 2016.04.22 29
» 컴퓨터와 인간의 대화[16]-UTF-16 황제낙엽 2016.04.22 15
46 컴퓨터와 인간의 대화[15]-UTF-8 황제낙엽 2016.04.22 14
45 컴퓨터와 인간의 대화[14]-euc(Extended UNIX Code) 황제낙엽 2016.04.22 15
44 컴퓨터와 인간의 대화[13]-char set 황제낙엽 2016.04.22 43
43 컴퓨터와 인간의 대화[12]-character encoding 황제낙엽 2016.04.22 10
42 컴퓨터와 인간의 대화[11]-byte 2 황제낙엽 2016.04.22 31
41 컴퓨터와 인간의 대화[10]-byte 1 황제낙엽 2016.04.22 20