UTF 8和GB2312有什麼不同?在什麼情況下用

時間 2021-09-07 06:11:34

1樓:窩窩惡少

不同的編碼。 各個國家和地區所制定的不同 ansi 編碼標準中,都只規定了各自語言所需的「字元」。比如:

漢字標準(gb2312)中沒有規定韓國語字元怎樣儲存。這些 ansi 編碼標準所規定的內容包含兩層含義: 1.

使用哪些字元。也就是說哪些漢字,字母和符號會被收入標準中。所包含「字元」的集合就叫做「字符集」。

2. 規定每個「字元」分別用一個位元組還是多個位元組儲存,用哪些位元組來儲存,這個規定就叫做「編碼」。各個國家和地區在制定編碼標準的時候,「字元的集合」和「編碼」一般都是同時制定的。

因此,平常我們所說的「字符集」,比如:gb2312, gbk, jis 等,除了有「字元的集合」這層含義外,同時也包含了「編碼」的含義。 「unicode 字符集」包含了各種語言中使用到的所有「字元」。

用來給 unicode 字符集編碼的標準有很多種,比如:utf-8, utf-7, utf-16, unicodelittle, unicodebig 等。 1、iso-8859-1:

最簡單的編碼規則,每一個位元組直接作為一個 unicode 字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 iso-8859-1 轉化為字串時,將直接得到 [0x00d6, 0x00d0] 兩個 unicode 字元,即 ""。反之,將 unicode 字串通過 iso-8859-1 轉化為位元組串時,只能正常轉化 0~255 範圍的字元。

2、gb2312,big5,shift_jis,iso-8859-2 把 unicode 字串通過 ansi 編碼轉化為「位元組串」時,根據各自編碼的規定,一個 unicode 字元可能轉化成一個位元組或多個位元組。反之,將位元組串轉化成字串時,也可能多個位元組轉化成一個字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 gb2312 轉化為字串時,將得到 [0x4e2d] 一個字元,即 '中' 字。

「ansi 編碼」的特點: 1. 這些「ansi 編碼標準」都只能處理各自語言範圍之內的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間的關係是人為規定的。 3、utf-8,utf-16,unicodebig 與「ansi 編碼」類似的,把字串通過 unicode 編碼轉化成「位元組串」時,一個 unicode 字元可能轉化成一個位元組或多個位元組。

與「ansi 編碼」不同的是: 1. 這些「unicode 編碼」能夠處理所有的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間是可以通過計算得到的。 參考資料:

2樓:

utf-8為國際標準支援幾乎所有的語言

gb2312為中國的語言標準

utf-8和gb2312有什麼區別啊

3樓:

不同的編碼。

各個國家和地區所制定的不同 ansi 編碼標準中,都只規定了各自語言所需的「字元」。比如:漢字標準(gb2312)中沒有規定韓國語字元怎樣儲存。

這些 ansi 編碼標準所規定的內容包含兩層含義:

1. 使用哪些字元。也就是說哪些漢字,字母和符號會被收入標準中。所包含「字元」的集合就叫做「字符集」。

2. 規定每個「字元」分別用一個位元組還是多個位元組儲存,用哪些位元組來儲存,這個規定就叫做「編碼」。

各個國家和地區在制定編碼標準的時候,「字元的集合」和「編碼」一般都是同時制定的。因此,平常我們所說的「字符集」,比如:gb2312, gbk, jis 等,除了有「字元的集合」這層含義外,同時也包含了「編碼」的含義。

「unicode 字符集」包含了各種語言中使用到的所有「字元」。用來給 unicode 字符集編碼的標準有很多種,比如:utf-8, utf-7, utf-16, unicodelittle, unicodebig 等。

1、iso-8859-1:

最簡單的編碼規則,每一個位元組直接作為一個 unicode 字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 iso-8859-1 轉化為字串時,將直接得到 [0x00d6, 0x00d0] 兩個 unicode 字元,即 "öð"。

反之,將 unicode 字串通過 iso-8859-1 轉化為位元組串時,只能正常轉化 0~255 範圍的字元。

2、gb2312,big5,shift_jis,iso-8859-2

把 unicode 字串通過 ansi 編碼轉化為「位元組串」時,根據各自編碼的規定,一個 unicode 字元可能轉化成一個位元組或多個位元組。

反之,將位元組串轉化成字串時,也可能多個位元組轉化成一個字元。比如,[0xd6, 0xd0] 這兩個位元組,通過 gb2312 轉化為字串時,將得到 [0x4e2d] 一個字元,即 '中' 字。

「ansi 編碼」的特點:

1. 這些「ansi 編碼標準」都只能處理各自語言範圍之內的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間的關係是人為規定的。

3、utf-8,utf-16,unicodebig

與「ansi 編碼」類似的,把字串通過 unicode 編碼轉化成「位元組串」時,一個 unicode 字元可能轉化成一個位元組或多個位元組。

與「ansi 編碼」不同的是:

1. 這些「unicode 編碼」能夠處理所有的 unicode 字元。

2. 「unicode 字元」與「轉換出來的位元組」之間是可以通過計算得到的。

4樓:範恕節風

只修改charset是不夠的,你還要把檔案重新儲存為對應的編碼才可以

utf-8和gb2312的區別,簡單點說,utf-8是用三個位元組來儲存一個漢字,而gb2312是用兩個位元組儲存一個漢字.

用記事本開啟你要轉換的檔案,修改charset,然後另存為,在另存為對話方塊下面編碼處選ansi即可.

5樓:碧思思**導航

是兩種不同的編碼,我們的導航**上面有哦。。。

utf8與gb2312有什麼區別

6樓:風之翼

gb2312是gbk的子集,gbk是gb18030的子集gbk是包括中日韓字元的大字符集合

如果是中文的** 推薦gb2312 gbk有時還是有點問題為了避免所有亂碼問題,應該採用utf-8,將來要支援國際化也非常方便utf-8可以看作是大字符集,它包含了大部分文字的編碼。

使用utf-8的一個好處是其他地區的使用者(如香港臺灣)無需安裝簡體中文支援就能正常**你的文字而不會出現亂碼。

網頁使用gb2312與utf-8有什麼區別

7樓:忒牛

用最易懂的說法就是utf-8裡包括gb2312。utf-8是國際通用的標準(包括世界所有的語言),而gb2312(只是簡體中文)只適合做中文的**。假設你想做箇中文網頁,但是還可以翻成英文的話,就得用utf-8。

如果用gb2312做的話,只能給中國人看看拉。

8樓:匿名使用者

理論上是gb2312載入的比utf-8快一些如果你的**只有國內訪客,那麼建議使用gb2312gb2312屬於中文編碼,主要針對國內使用者使用,如果國外使用者訪問gb2312編碼的**就會變亂碼。

如果有國外使用者必須用utf-8

utf-8是世界性通用**,也完美的支援中文編碼

關於html中的gb2312和utf-8用法?

9樓:慶亮

這個不是很清來楚,看了就當源

是隨便說說。英語是國際通用的語言,國際上一般都認可,但你不能說這個英語好啊,大家不要漢語了,不要俄語了~~~ 總的來說,一般包含中文字元的時候用gb2312,用到一些特殊字元,例如西歐字元的時候應該用utf-8,以防出現亂碼。不過utf-8某些時候不好控制,控制的不好容易出現亂碼,例如在將資料寫入資料庫時,用utf-8是比較容易出現亂碼情況的。

呵呵,懂得不多,如有錯誤歡迎指教~

10樓:萢萢

gb2312編碼適用於

bai漢字

du處理、漢字通訊等系統之間的zhi資訊交換,通dao行於中國大陸;新加坡回等地也採用此編答碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援gb 2312。基本集共收入漢字6763個和非漢字圖形字元682個。

整個字符集分成94個區,每區有94個位。每個區位上只有一個字元,因此可用所在的區和位來對漢字進行編碼,稱為區位碼。

utf-8(8-bit unicode transformation format)是一種針對unicode的可變長度字元編碼,又稱萬國碼。由ken thompson於2023年建立。現在已經標準化為rfc 3629。

utf-8用1到6個位元組編碼unicode字元。用在網頁上可以同一頁面顯示中文簡體繁體及其它語言(如英文,日文,韓文)。

其使用方式是在head中使用meta配置,如下:

11樓:匿名使用者

如果你會用utf-8,當然最好,不過在做的時候,還是用gb2312方便很多,如果用utf-8的話,要把中文的字變為utf-8碼才行的,那樣你的網頁的源程式都是數字來的,你寫程式不方便吧~~

有ASCII編碼檔案轉utf8檔案的批處理工具嗎

我記得有一個c語言編寫的 你好!請問怎樣將ascii碼的字串轉換成utf8?15 python ascii 編碼 怎麼轉化為utf 8編碼?5 實現 如下 a abce print type a b a.decode ascii print type b c a.decode ascii encod...

GB8162和GB8163有什麼區別

一 指代不同 1 gb8163 鋼管 流體管 是一種具有中空截面,從頭到尾的沒有焊縫。2 gb8162 此標準適用於一般結構 機械結構用無縫鋼管。二 特點不同 1 gb8163 與圓鋼等實心鋼材相比,在抗彎抗扭強度相同時,重量較輕,是一種經濟截面鋼材,廣泛用於製造結構件和機械零件,如石油鑽桿 汽車傳...

蘋果7和蘋果8有什麼不同,蘋果8和蘋果7有什麼區別?

田田釣魚 蘋果7和蘋果8,哪一款最值得買 太平洋電腦網 兩款手機主要區別包括機身材質 處理器 電池容量方面。在機身材質方面,前者後背採用金屬材質,後者則採用面玻璃材質 處理器方面,前者搭載蘋果a10 fusion處理器,後者搭載a11仿生處理器 電池容量方面,前者配備1960mah電池,後者配備18...