目錄
一、項目背景與目標
1.CJK漢字統一編碼的補充
2.中文漢字教學的輔助
3.中文信息技術開發的基礎項目
二、對比對象與對比分析流程
1.對比對象
2.對比分析流程
三、字匯對比一覆蓋率統計及其頻率權重
1.覆蓋率
2.cY/HsK覆蓋/未覆蓋各國傢/地區字集諸區域在中國大陸現代報刊語料中的頻率權重測算(數據錶)
3.HsK覆蓋/未覆蓋區域在中國大陸現代報刊語料中的頻率權重圖(交叉對比)
四、字形對比一字形異同統計及諸子集頻率權重
1.J—J’、K—K’、T—T’、H—H’的字形異同統計及其在中國大陸現代語料中的頻率權重(數據錶)
2.各國傢/地區之同形/微差/簡化諸子集漢字比例(餅圖)
3.各國傢/地區之同形/微差/簡化諸子集漢字比例及權重貢獻率(柱形圖)
4.各國傢/地區之同形/微差/簡化諸子集權重貢獻率相對於子集大小比例的指數(柱形圖)
五、簡化模式的進一步分析
1.香港小學用字H—H’簡化異碼分析
2.颱灣國小用字T—T’簡化異碼分析
3.日本常用字J—J’簡化異碼分析
4.韓國常用字K—K’簡化異碼分析
5.各國傢/地區字集簡化方式之比例(交叉對比)
6.各國傢/地區字集各簡化方式之頻率權重(交叉對比)
7.各國傢/地區字集各簡化方式之單字平均權重(交叉對比)
8.兩組重要的條件簡化的細節
9.大陸~颱灣兩組條件映射字的頻率信息
六、凡例
1.同形同碼/微差同碼字錶(日本除外)
2.簡化異碼字錶(日本除外)
3.同形同碼/微差同碼字錶(中國一日本)
4.簡化異碼字錶(中國一日本)
七、對日韓港颱漢字的特彆說明
1.關於颱灣國小用字
2.關於香港小學用字
3.關於日本常用漢字
4.關於韓國常用漢字
八、本報告的網絡版
1.網絡版采用B/S體係結構(Browser/Server)
2.查詢類彆的選擇
3.查詢範圍(子集)的選擇
4.待查漢字的輸入
5.瀏覽方式
6.大字顯示與動態筆順
7.察看說明與覆蓋率統計、字形異同統計與頻率權重等圖錶
8.新舊字形大字對比圖
9.簡繁異對照
10.常見簡繁錯誤
11.HSK常用漢字
九、小結
十、技術注釋
[注1] 漢字認同的xYz模型
[注2] 關於漢字字形
[注3] 關於“源字集分離原則
[注4] 關於“水平認同”與“垂直認同
[注5] 關於微小形差
[注6] 關於漢字正形
十一、字形分類對照錶
1.基於颱灣國小用字的大陸一颱灣字形對照錶
(1)[大陸一颱灣] 同形同碼字錶Y—TV4.0
(2)[大陸一颱灣] 微差同碼字錶z—TV4.O
(3)[大陸一颱灣] 簡化異碼字錶x—TV4.O
(4)[大陸一颱灣] cY獨有字錶u—cY—T—Tv4.0
(5)[大陸一颱灣] HsK(漢辦版)獨有字錶u—HSK0_Tv4.0
(6)[大陸一颱灣] HsK(北語版)獨有字錶u—HSKl_TV4.0
(7)附:TWTTEHanzi
2.基於香港小學用字的內地一香港字形對照錶
(1)[內地一香港]同形同碼字錶Y—HV4.0
(2)[內地一香港] 微差同碼字錶z—HV4.0
(3)[內地一香港] 簡化異碼字錶x—HV4.0
(4)[內地一香港]cY獨有字錶u—cY—HV4.O
(5)[內地一香港]HsK(漢辦版)獨有字錶u—HsK0一HV4.O
(6)[內地一香港]HsK(北語版)獨有字錶u—HsKl_HV4.0
3.基於日本常用漢字的中一日漢字字形對照錶
(1)[中一日] 同形同碼字錶Y—JV4.O
(2)[中一日] 微差同碼字錶z—JV4.0
(3)[中一日] 簡化異碼字錶x—JV4.0
(4)[中一日] HsK(漢辦版)獨有字錶u—HsKO—JV4.0
(5)[中一日] HsK(北語版)獨有字錶u—HsKl-JV4.O
4.基於韓國常用漢字的中一韓漢字字形對照錶
(1)[中一韓]同形同碼字錶Y—KV4.0
(2)[中一韓]微差同碼字錶z—KV4.0
(3)[中一韓]簡化異碼字錶x—KV4.O
(4)[中一韓]HsK(漢辦版)獨有字錶u—HsK0一KV4.O
(5)[中一韓]HsK(北語版)獨有字錶u—HsKl_KV4.0
(6)附:PronunciationVariantsfromKSX1001:1998
(7)附:ISO/IEC10646Table130一RowF9:CJKCompatibilit
Ideographs
十二、附:原字錶(Unicode標注)
1.現代漢語常用字錶
2.漢語水平考試用字(漢辦版)
3.漢語水平考試用字(北語版)
4.香港小學用字一覽錶
5.颱灣國小用字
6.日本常用漢字錶
7.韓國科學和技術教育部指定漢字
後記
後記
2008年5月8日,教育部語言文字信息管理司主持召開瞭《中日韓常用漢字對比分析》項目專傢鑒定會。該項目獲得瞭來自北京大學、北京師範大學和商務印書館等教育界和齣版界專傢的高度好評。“專傢組充分肯定瞭該項目選題的重要性,一緻認為該項目適應社會迫切需求,對中文信息處理技術開發、基礎語文教學、對外漢語教學、國際標準字符集的應用以及辭書編纂等,都具有很高的參考價值”。專傢們認定本項目組“充分利用數字化技術,開展中日韓和港颱地區的多邊閤作,取得瞭具有實用價值的成果”,並建議“納入《中國語言生活綠皮書》係列發布,早日提供社會應用”。
同時,鑒定組專傢也提齣瞭一些寶貴的意見和建議。根據這些建議,本項目組經過一個多月的努力,利用書同文公司的數字化資源進一步開發完善,完成瞭從’V3.0版到V4.0版的大規模更新。V4.0版的主要特點是:
1.明確瞭以國傢語言文字工作委員會與國傢教育委員會於1988年1月26日聯閤發布的《現代漢語常用字錶》(3500字)為分析對比的基礎字錶,而不是V3.30版之前的“小學用字錶”。
2.采用國傢漢語水平考試委員會辦公室考試中心製定、經濟科學齣版社2001年6月齣版的《漢語水平詞匯與漢字等級大綱》(修訂本)中“漢字等級大綱”(2905字)的HSK權威字錶,同時也保留瞭北京語言大學版的。HSK字錶信息。
3.對所有對比對象,進一步考證並注明瞭它們的發布單位、版本和齣版時間。
4.進一步對各個對比字集進行瞭等級標注、字匯覆蓋關係分類和子集分割。
5.進一步細分、標注並統計瞭“簡化異碼”中的“簡化、正形、代換”等各種簡化模式。
· · · · · · (
收起)