漢字字彙(英語:Ideographic repertoire),在中文信息處理領域中,是指「用漢字編碼字符集或者類別指定的漢字集合」[1]

用漢字編碼字符集指定的集合如:GB 2312GBKJIS 0208

用類別指定的集合如:簡化字繁體字傳承字異體字類推簡化字略字外字

字彙本身不涉及編碼的概念,只是表明「多少字」,「哪些字」。[1]例如:通常所稱的簡化漢字是指《簡化字總表》中的簡化漢字,總數為2235個。[1]GB 2312中的簡體字對應的繁體字有兩千多個。[1]GB 2312中的傳承字有四千多個。[1]《中華大字典》收字四萬八千多個。

參考 編輯

  1. ^ 1.0 1.1 1.2 1.3 1.4 計算機科學技術百科全書 清華大學出版社 277頁[缺少ISBN]