sitelink1 https://ko.wikipedia.org/wiki/UTF-8 
sitelink2  
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

UTF-8 - 위키백과, 우리 모두의 백과사전

 

UTF-8유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로, 켄 톰프슨롭 파이크가 만들었다. UTF-8은 Universal Coded Character Set + Transformation Format – 8-bit 의 약자이다. 본래는 FSS-UTF(File System Safe UCS/Unicode Transformation Format)라는 이름으로 제안되었다.

UTF-8 인코딩은 유니코드 한 문자를 나타내기 위해 1바이트에서 4바이트까지를 사용한다. 예를 들어서, U+0000부터 U+007F 범위에 있는 ASCII 문자들은 UTF-8에서 1바이트만으로 표시된다. 4바이트로 표현되는 문자는 모두 기본 다국어 평면(BMP) 바깥의 유니코드 문자이며, 거의 사용되지 않는다. UTF-16과 UTF-8 중 어느 인코딩이 더 적은 바이트를 사용하는지는 문자열에서 사용된 코드 포인트에 따라 달라지며, 실제로 DEFLATE와 같은 일반적인 압축 알고리즘을 사용할 경우 이 차이는 무시할 수 있을 정도이다. 이러한 압축 알고리즘을 사용하기 힘들고 크기가 중요할 경우 유니코드 표준 압축 방식을 대신 사용할 수 있다.

번호 제목 글쓴이 날짜 조회 수
공지 2023 Software Development Trend 정리 황제낙엽 2024.01.19 1
60 REST API 제대로 알고 사용하기 황제낙엽 2021.06.02 21
59 locale (로캘, 로케일) 황제낙엽 2021.03.19 15
58 [REST API] HTTP METHOD 종류 황제낙엽 2021.01.14 30
57 [Deno] TypeScript를 실행하기 위한 Command-line 런타임 황제낙엽 2021.01.14 8
56 어린이, 청소년용 프로그램 입문 황제낙엽 2017.05.03 69
55 컴퓨터는 음수를 2의 보수법으로 표현한다 file 황제낙엽 2016.10.24 753
54 변수를 unsigned int형 선언 0xffffffff 할당 결과가 -1이 되는 이유는? 황제낙엽 2016.10.24 376
53 0xFFFFFFFF의 값은 왜 -1인가? 황제낙엽 2016.10.24 177
52 unsigned와 signed 황제낙엽 2016.10.24 81
51 컴퓨터와 인간의 대화[20]-전각 문자와 반각 문자 황제낙엽 2016.04.22 122
50 컴퓨터와 인간의 대화[19]-인텔 HEX 황제낙엽 2016.04.22 28
49 컴퓨터와 인간의 대화[18]-베이스64 황제낙엽 2016.04.22 30
48 컴퓨터와 인간의 대화[17]-Surrogate Pair, Supplementary Characters file 황제낙엽 2016.04.22 29
47 컴퓨터와 인간의 대화[16]-UTF-16 황제낙엽 2016.04.22 15
» 컴퓨터와 인간의 대화[15]-UTF-8 황제낙엽 2016.04.22 14
45 컴퓨터와 인간의 대화[14]-euc(Extended UNIX Code) 황제낙엽 2016.04.22 15
44 컴퓨터와 인간의 대화[13]-char set 황제낙엽 2016.04.22 43
43 컴퓨터와 인간의 대화[12]-character encoding 황제낙엽 2016.04.22 10
42 컴퓨터와 인간의 대화[11]-byte 2 황제낙엽 2016.04.22 31
41 컴퓨터와 인간의 대화[10]-byte 1 황제낙엽 2016.04.22 19