萬能編碼轉(zhuǎn)換器(unicode編碼)
哈嘍,大家好~~~我是小編田甜,關(guān)于萬能編碼轉(zhuǎn)換器,unicode編碼這個(gè)很多人還不知道,那么現(xiàn)在讓田甜帶著大家一起來看看吧!
世界上存在著多種編碼方式,同一個(gè)二進(jìn)制數(shù)字可以被解釋成不同的符號(hào)。
因此,要想打開一個(gè)文本文件,就必須知道它的編碼方式,否則用錯(cuò)誤的編碼方式解讀,就會(huì)出現(xiàn)亂碼。
為什么電子郵件常常出現(xiàn)亂碼?就是因?yàn)榘l(fā)信人和收信人使用的編碼方式不一樣。
可以想象,如果有一種編碼,將世界上所有的符號(hào)都納入其中。
每一個(gè)符號(hào)都給予一個(gè)獨(dú)一無二的編碼,那么亂碼問題就會(huì)消失。
這就是 Unicode,就像它的名字都表示的,這是一種所有符號(hào)的編碼。
歷史上存在兩個(gè)試圖獨(dú)立設(shè)計(jì) Unicode 的組織,即國際標(biāo)準(zhǔn)化組織(ISO)和一個(gè)軟件制造商的協(xié)會(huì)(***.org)。
ISO 開發(fā)了 ISO 10646 項(xiàng)目,Unicode 協(xié)會(huì)開發(fā)了 Unicode 項(xiàng)目。
在1991年前后,雙方都認(rèn)識(shí)到世界不需要兩個(gè)不兼容的字符集。
于是它們開始合并雙方的工作成果,并為創(chuàng)立一個(gè)單一編碼表而協(xié)同工作。
從 Unicode2.0 開始,Unicode 項(xiàng)目采用了與 ISO 10646-1 相同的字庫和字碼。
目前兩個(gè)項(xiàng)目仍都存在,并獨(dú)立地公布各自的標(biāo)準(zhǔn)。
Unicode 協(xié)會(huì)現(xiàn)在的最新版本是2005年的 Unicode 4.1.0。
ISO 的最新標(biāo)準(zhǔn)是 10646-3:2003。
Unicode 是一個(gè)很大的集合,現(xiàn)在的規(guī)模可以容納100多萬個(gè)符號(hào)。
每個(gè)符號(hào)的編碼都不一樣,比如,U+0639表示阿拉伯字母Ain,U+0041表示英語的大寫字母A,U+4E00表示漢字"一"。
具體的符號(hào)對(duì)應(yīng)表,可以查詢 ***.org,或者專門的漢字對(duì)應(yīng)表。
Unicode的問題需要注意的是,Unicode 只是一個(gè)符號(hào)集,它只規(guī)定了符號(hào)的二進(jìn)制代碼,卻沒有規(guī)定這個(gè)二進(jìn)制代碼應(yīng)該如何存儲(chǔ)。
比如,漢字"一"的 unicode 是十六進(jìn)制數(shù)4E00,轉(zhuǎn)換成二進(jìn)制數(shù)足足有15位(100111000000000),也就是說這個(gè)符號(hào)的表示至少需要2個(gè)字節(jié)。
而表示其他更大的符號(hào),可能需要3個(gè)字節(jié)或者4個(gè)字節(jié),甚至更多。
這里就有兩個(gè)的問題,一個(gè)是,如何才能區(qū)別 unicode 和 ascii?計(jì)算機(jī)怎么知道三個(gè)字節(jié)表示一個(gè)符號(hào),而不是分別表示三個(gè)符號(hào)呢?第二個(gè)問題是,我們已經(jīng)知道,英文字母只用一個(gè)字節(jié)表示就夠了,如果unicode統(tǒng)一規(guī)定,每個(gè)符號(hào)用三個(gè)或四個(gè)字節(jié)表示,那么每個(gè)英文字母前都必然有二到三個(gè)字節(jié)是0,這對(duì)于存儲(chǔ)空間來說是極大的浪費(fèi),文本文件的大小會(huì)因此大出二三倍,這是難以接受的。
它們?cè)斐傻闹苯咏Y(jié)果是:出現(xiàn)了unicode 的多種存儲(chǔ)方式,也就是說有許多種不同的二進(jìn)制格式,可以用來表示 unicode 。
另外 unicode 在很長一段時(shí)間內(nèi)無法推廣,直到互聯(lián)網(wǎng)的出現(xiàn)。
網(wǎng)絡(luò)上流行的utf-8就是unicode編碼的一類應(yīng)用.如何查詢 Unicode 編碼在 Windows 系統(tǒng)下,你可以在運(yùn)行欄輸入 "eudcedit.exe" 調(diào)用 TrueType 造字程序,在其中的窗口--參照頁,在"代碼"欄輸入 Unicode 編碼可以查找到相應(yīng)的字符;在"形狀"欄輸入字符則可以查找到相應(yīng)的 Unicode 編碼 。
本文分享完畢,希望對(duì)大家有所幫助哦。
免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
- 震驚!LCK 新晉天才新人登場(chǎng),對(duì)
- 明日之后新年之際,新房等待入住
- 暗區(qū)突圍 7 級(jí)頭及暗區(qū)突圍四大
- 鳴潮中菲比的突破材料如何獲?。?/a>
- 當(dāng)前 dnf 中哪個(gè)職業(yè)更易混團(tuán)?
- 原神:一款充滿樂趣與挑戰(zhàn)的手游
- 暗區(qū)突圍人機(jī)對(duì)戰(zhàn)模式:暗區(qū)突圍
- dnf 不同起源強(qiáng)化卷性價(jià)比對(duì)比
- 神谷英樹:他所打造的所有游戲皆
- DNF 締造者適合用哪款傳說裝備?
- 特朗普曾下令對(duì)‘伊斯蘭國’成員
- 魔獸世界 WLK 情人節(jié)掉落 245B