什麼是字元編碼?

當我們在安裝軟體的時候,常常會看到中文版、英文版…等等各國語言的版本,字元編碼的用意也就是在處理電腦文字語言的問題。當你開啟任何一個網頁,選擇瀏覽器工能表上的「工具/網頁>編碼」(每個瀏覽器不太一樣),就會看到很多種編碼的型式,表示這個網頁要用什麼編碼讀取。例如繁體中文(Big5)、簡體中文(GBK)等等,這些代號都是固定的。當你開啟一個網頁,卻發現它的字都花掉變成亂碼時,就要去修改它的編碼才會回復正常。

原本各國都有各自的編碼,但是後來因為國與國之間的資訊交流頻繁,逐漸發展出了「萬國碼(Unicode)」,在萬國碼裡包含許多國家的文字,繁體中文(Big5)找不到的字,有時候在萬國碼裡就可以找到。

在編輯HTML網頁時,通常在之間會有一行的編碼的宣告,告訴網友的瀏覽器這個網頁所使用的編碼格式(請參考XHTML網頁資訊篇)。如果檔案儲存的編碼格式和讀取時的格式不同,就會產生亂碼。

在網頁的表單中,如果使用POST傳遞資料,則輸入的值就會使用”來源網頁”的編碼格式傳遞。所以如果一個Big5編碼的網頁要傳資料給UTF-8(Unicode)的網頁時,就會產生亂碼。如果網頁的表單使用GET來傳遞資料,則文字的編碼為英文(ISO-8859-1),中文字必需要轉碼後才能正常讀取。

最後,當你想要用HTML撰寫一些特殊符號例如 ♠ ♣ ♥ ♦ 的時候,你可以查詢HTML的特殊符號表(HTML Codes)最常被使用的是<>,它可以避免你打的符號被視為網頁的標籤語法。