欧美黑人激情性久久,一本色道久久综合无码人妻,欧美另类人妻制服丝袜,日韩精品一卡2卡3卡4卡新区乱码,欧洲熟妇性色黄在线观看免费,97夜夜澡人人爽人人喊中国片,77se77亚洲欧美在线,久久精品一区二区免费播放

                    名詞解釋:Unicode和UTF-8

                    一直在編碼方面要求不是很高,所以對Unicode和UTF-8也不甚了解。 最近偶然翻到一篇UTF-8的文章,感覺解釋的非常繁雜,因此才想到重新寫一篇簡單易懂一點的。 首先說明一下現在常用的一些編碼方案: 1、在中國,大陸最常用的就是GBK18030編碼,除此之外還有GB

                    一直在編碼方面要求不是很高,所以對Unicode和UTF-8也不甚了解。

                      最近偶然翻到一篇UTF-8的文章,感覺解釋的非常繁雜,因此才想到重新寫一篇簡單易懂一點的。

                      首先說明一下現在常用的一些編碼方案:
                      1、在中國,大陸最常用的就是GBK18030編碼,除此之外還有GBK,GB2312,這幾個編碼的關系是這樣的。

                    最早制定的漢字編碼是GB2312,包括6763個漢字和682個其它符號
                    95年重新修訂了編碼,命名GBK1.0,共收錄了21886個符號。
                    之后又推出了GBK18030編碼,共收錄了27484個漢字,同時還收錄了藏文、蒙文、維吾爾文等主要的少數民族文字,現在WINDOWS平臺必需要支持GBK18030編碼。

                    按照GBK18030、GBK、GB2312的順序,3種編碼是向下兼容,同一個漢字在三個編碼方案中是相同的編碼。

                      2、臺灣,香港等地使用的是BIG5編碼
                      3、日本:SJIS編碼

                      如果把各種文字編碼形容為各地的方言,那么Unicode就是世界各國合作開發的一種語言。
                      在這種語言環境下,不會再有語言的編碼沖突,在同屏下,可以顯示任何語言的內容,這就是Unicode的最大好處。

                      那么Unicode是如何編碼的呢?其實非常簡單。
                      就是將世界上所有的文字用2個字節統一進行編碼??赡苣銜枺?個字節最多能夠表示65536個編碼,夠用嗎?
                      韓國和日本的大部分漢字都是從中國傳播過去的,字型是完全一樣的。
                      比如:“文”字,GBK和SJIS中都是同一個漢字,只是編碼不同而已。
                      那樣,像這樣統一編碼,2個字節就已經足夠容納世界上所有的語言的大部分文字了。

                      Unicode的學名是”Universal Multiple-Octet Coded Character Set”,簡稱為UCS。
                      現在用的是UCS-2,即2個字節編碼,而UCS-4是為了防止將來2個字節不夠用才開發的。UCS-2也稱為基本多文種平面。
                      UCS-2轉換到UCS-4只是簡單的在前面加2個字節0。
                      UCS-4則主要用于保存輔助平面,例如Unicode 4.0中的第二輔助平面
                      20000-20FFF – 21000-21FFF – 22000-22FFF – 23000-23FFF – 24000-24FFF – 25000-25FFF –   26000-26FFF – 27000-27FFF – 28000-28FFF – 29000-29FFF – 2A000-2AFFF – 2F000-2FFFF
                      總共增加了16個輔助平面,由原先的65536個編碼擴展至將近100萬編碼。

                      那么既然統一了編碼,如何兼容原先各國的文字編碼呢?
                      這個時候就需要codepage了。
                      什么是codepage?codepage就是各國的文字編碼和Unicode之間的映射表。
                      比如簡體中文和Unicode的映射表就是CP936,點這里查看官方的映射表。

                      以下是幾個常用的codepage,相應的修改上面的地址的數字即可。
                    codepage=936 簡體中文GBK
                    codepage=950 繁體中文BIG5
                    codepage=437 美國/加拿大英語
                    codepage=932 日文
                    codepage=949 韓文
                    codepage=866 俄文
                    codepage=65001 unicode UFT-8

                    最后一個65001,據個人理解,應該只是一個虛擬的映射表,實際只是一個算法而已。

                    從936中隨意取一行,例如:
                    0x9993 0x6ABD #CJK UNIFIED IDEOGRAPH
                    前面的編碼是GBK的編碼,后面的是Unicode。
                    通過查這張表,就能簡單的實現GBK和Unicode之間的轉換。


                      現在明白了Unicode,那么UTF-8又是什么呢?又為什么會出現UTF-8呢?

                      ASCII轉換成UCS-2,只是在編碼前插入一個0x0。用這些編碼,會包括一些控制符,比如 或 /,這在UNIX和一些C函數中,將會產生嚴重錯誤。因此可以肯定,UCS-2不適合作為Unicode的外部編碼。

                      因此,才誕生了UTF-8。那么UTF-8是如何編碼的?又是如何解決UCS-2的問題呢?

                    例:
                    E4 BD A0        11100100 10111101 10100000
                    這是“你”字的UTF-8編碼
                    4F 60          01001111 01100000
                    這是“你”的Unicode編碼

                    按照UTF-8的編碼規則,分解如下:xxxx0100 xx111101 xx100000
                    把除了x之外的數字拼接在一起,就變成“你”的Unicode編碼了。
                    注意UTF-8的最前面3個1,表示整個UTF-8串是由3個字節構成的。
                    經過UTF-8編碼之后,再也不會出現敏感字符了,因為最高位始終為1。

                    以下是Unicode和UTF-8之間的轉換關系表:

                    U-00000000 – U-0000007F: 0xxxxxxx
                    U-00000080 – U-000007FF: 110xxxxx 10xxxxxx
                    U-00000800 – U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx
                    U-00010000 – U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
                    U-00200000 – U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
                    U-04000000 – U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

                    Unicode編碼轉換到UTF-8,簡單的把Unicode字節流套到x中就變成UTF-8了。

                    給TA打賞
                    共{{data.count}}人
                    人已打賞
                    HTML教程

                    Iframe中各個元素的用法

                    2007-10-6 2:23:00

                    HTML教程

                    HTML中特殊字符的顯示

                    2007-10-8 1:37:00

                    0 條回復 A文章作者 M管理員
                      暫無討論,說說你的看法吧
                    ?
                    個人中心
                    購物車
                    優惠劵
                    有新私信 私信列表
                    搜索
                    主站蜘蛛池模板: 国产真实的和子乱拍在线观看| 久久亚洲精品人成综合网| 欧美精品18videosex性欧| 日本熟妇人妻xxxxx人hd | 欲香欲色天天综合久久| 伊人av超碰伊人久久久| 中文字幕无码日韩专区免费| 亚洲另类欧美小说图片区 | 中文字幕av久久一区二区| 色偷偷天堂av狠狠狠在| 成年无码av片| 成年无码a√片在线观看| 国产亚洲国产亚洲国产亚洲| 国产精品卡一卡二卡三| 国产360激情盗摄全集| 亚洲国产一区二区精品专| 亚洲精品久久久一区| 精品久久久久国产免费| 国产人妻黑人一区二区三区| 精品网站一区二区三区网站| 久爱www人成免费网站| 亚洲成av人片在线播放无码| 国产成人无码精品久久涩吧 | 成人国内精品久久久久一区| 亚洲偷偷自拍高清| 尹人香蕉久久99天天拍| 成人影院免费观看在线播放视频| 丰满的少妇xxxxx青青青| 男女性高爱潮免费网站| 色优久久久久综合网鬼色| 国产av天堂无码一区二区三区| 亚洲欧美洲成人一区二区| 亚洲精品电影院| 青娱乐极品视觉盛宴av| 天干天干夜天干天天爽| 日日碰狠狠躁久久躁96avv| 天躁夜夜躁狼狠躁| 999精品无码a片在线1级| 自拍第一区视频在线观看| 日本精品久久久久中文字幕| 亚洲中文字幕琪琪在线|