CJK文字

中文、日文、韓文等包含漢字及其衍伸文字的總稱

国际化中,CJK文字中文日文韩文的统称,这些语言全部含有汉字及其变体,某些会与其他文字混合使用。因为越南文曾经使用汉字,所以它有时候与CJK文字结合,组成CJKV文字。概括来说,CJKV文字通常包括中文汉字日文汉字假名、韩文的汉字及谚文和越南文的儒字喃字

CJKV文字源自古代汉字。 由左至右:日文、越南文、韩文、简体中文及繁体中文。

文字一览 编辑

标准普通话和广东话几乎可以全数使用汉字表达,基本识字需要3000字,而囊括全部日常用语则需要40000字。而日文使用汉字较少,所需的基本识字量预计为2163字,列于常用汉字表中。韩国使用汉字的情况越来越少,但因为特殊的专有名词需要更多的字符解释,所以仍需要学习汉字。时至今日,韩国学校仍教授学生约1800字。

中文的注音汉语拼音、日文的平假名片假名、韩文的谚文,严格上都不是“CJK文字”。但多数CJK字集为了涵盖目标语言的全部文字,而包括这些拼音文字。

直至20世纪初,越南政府和学界沿用文言文为书写语言,而当时越南的流行读物却是以结合中文汉字和大量越南本土制造的文字——喃字撰写。1920年代末,喃字及文言文被基于拉丁字母的越南文字母——国语字取代。

1971年,汉学家卡尔·莱班对CJK编码系统作出了早期调查。

编码 编辑

由于完全收录 CJK 文字所要的数量远大于 8 比特字符编码所支持的 256 个字符,所以需要最少 16 比特定长编码或多字节的可变长度编码。