字符集(Charcater Set)與字符編碼(Encoding)

0x01 基礎知識

在了解編碼是怎麼一回事之前,我們必須要先知道2個概念,那就是位和字節。位(bit)是指電腦裡面存放的二進制數值=0或者1。而只要有8個位便可稱之為字節(byte)。例子:01000001,在16進制裡面,這個字節=0x41。

字符編碼的意思是電腦會使用某種規則將平時我們日常生活中會用到的一些文字/符號轉換成電腦可以讀取的二進制數字進行相互的轉換。

例子:電腦使用ASCII字符集來進行字母“A”的轉換。
01000001(0x41)<-> 65 <-> 'A'

在編碼時,這些規則就會用所謂的字符集來處理字符和二進制數字代碼之間的轉換。

而字符集則是一個系統支持的所有抽象字符的集合。這些字符就是各種文字和符號的總稱。通常包括了各個國家文字、標點符號、圖形符號、數字等等。

0x02 常見的字符集和字符編碼

Unicode編碼

Ascii編碼

中文類別的編碼

未完待續

0%