CJK文字

中文、日文、韓文等包含漢字及其衍伸文字的總稱

國際化中,CJK文字中文日文韓文的統稱,這些語言全部含有漢字及其變體,某些會與其他文字混合使用。因為越南文曾經使用漢字,所以它有時候與CJK文字結合,組成CJKV文字。概括來說,CJKV文字通常包括中文漢字日文漢字假名、韓文的漢字及諺文和越南文的儒字喃字

CJKV文字源自古代漢字。 由左至右:日文、越南文、韓文、簡體中文及繁體中文。

文字一覽 編輯

標準普通話和廣東話幾乎可以全數使用漢字表達,基本識字需要3000字,而囊括全部日常用語則需要40000字。而日文使用漢字較少,所需的基本識字量預計爲2163字,列於常用漢字表中。韓國使用漢字的情況越來越少,但因為特殊的專有名詞需要更多的字符解釋,所以仍需要學習漢字。時至今日,韓國學校仍教授學生約1800字。

中文的注音漢語拼音、日文的平假名片假名、韓文的諺文,嚴格上都不是「CJK文字」。但多數CJK字集為了涵蓋目標語言的全部文字,而包括這些拼音文字。

直至20世紀初,越南政府和學界沿用文言文為書寫語言,而當時越南的流行讀物卻是以結合中文漢字和大量越南本土製造的文字——喃字撰寫。1920年代末,喃字及文言文被基於拉丁字母的越南文字母——國語字取代。

1971年,漢學家卡爾·萊班對CJK編碼系統作出了早期調查。

編碼 編輯

由於完全收錄 CJK 文字所要的數量遠大於 8 比特字符編碼所支持的 256 個字符,所以需要最少 16 比特定長編碼或多字節的可變長度編碼。