表意文字描述字符





注意:本页面含有Unihan新版用字:「𠀬𠁢𠂊𠂗𠋑𠚤𢧌𣏃𤆯𥘶𧆬𧓉」。有关字符可能會错误显示,詳见Unicode扩展汉字。

body.skin-minerva .mw-parser-output table.infobox caption{text-align:center}

































Ideographic Description Characters
范围
U+2FF0–U+2FFF
(16個碼位)
平面
基本多文種平面(BMP)
字符
通用英语Script (Unicode)#Special script property values
分配
12个码位
未分配
4个保留码位
來源標準
GB 2312-80
Unicode版本歷史


3.0
12 (+12)

[1][2]

表意文字描述字符(英:Ideographic Description Character,IDC),是Unicode自 3.0 後對漢字所做的一種支援。


目前大部的編碼包含Unicode,對於漢字編碼的處理大致為先搜集漢字,給予每個漢字一個數字編碼。然而,漢字數量龐大,往往字集不完全。再加上漢字本身具有組合以及開放的特性,漢字使用者很有可能自造新字,因此不可能有一個字集可以搜集到所有漢字,所以用這樣的字符來描述某一個「字」是如何被更基本的部件組合起來。




目录






  • 1 編碼方式


  • 2 说明


  • 3 限制


  • 4 另見


  • 5 參考文獻


  • 6 外部連結





編碼方式












































表意文字描述字符
Ideographic Description Characters
[1][2]
Unicode Consortium官方代码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+2FFx

















注解

1.^ 依据Unicode 8.0

2.^ 灰色区域指示未被分配的码点




说明


Unicode定義了十二種組合字符:
























































































































碼號 字符 意義 例字 序列 例字 序列
2FF0 兩個部件由左至右組成 ⿰木目 𠁢 ⿰丨㇍
2FF1 兩個部件由上至下組成 ⿱木口 𠚤 ⿱𠂊丶
2FF2 三個部件由左至右組成 ⿲彳氵亍 𠂗 ⿲丿夕乚
2FF3 三個部件由上至下組成 ⿳亠口小 𠋑 ⿳亼目口
2FF4 兩個部件由外而內組成 ⿴囗口 𠀬 ⿴㐁人
2FF5 三面包圍,下方開口 ⿵几皇 𧓉 ⿵齊虫
2FF6 三面包圍,上方開口 ⿶凵㐅 ⿶乂丶
2FF7 三面包圍,右方開口 ⿷匚斤 𧆬 ⿷虎九
2FF8 兩面包圍,兩個部件由左上至右下組成 ⿸疒丙 𤆯 ⿸耂火
2FF9 兩面包圍,兩個部件由左下至右上組成 ⿹戈廾 𢧌 ⿹或壬
2FFA 兩面包圍,兩個部件由右上至左下組成 ⿺走召 𥘶 ⿺礼分
2FFB 兩個部件重疊 ⿻工从 𣏃 ⿻木⿻コ一

其表示方式為前綴表示法。



限制


  • 一個漢字依現行提案,可能會有多種組合方式,Unicode尚未定義如何作出單一表述。


另見



  • 動態組字

  • 組合字符



參考文獻





  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. 


  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. 




外部連結



  • Unicode的表意文字組合字符碼位一覽

  • Unicode的東亞文字處理

  • http://unicode.org/iuc/iuc18/papers/b16.ppt






Comments

Popular posts from this blog

Monte Carlo

Information security

章鱼与海女图