组合字符Combining character)在字体排印学中是用来改变其它字符所用的字符。在拉丁字母中,最常见的组合字符为附加符号(包含重音号)。 [1]

西里尔字母У短音符组合成Ў.

统一码也包含许多预组字符(Precomposed character),即事先将字符组好并赋予码位。所以有可能同时使用组合字符和预组字符。这导致了若要比较两个统一码字符串或设计编码转换器时,需要先执行Unicode正规化[2]

在统一码中,用于欧洲语言和国际音标的组合用附加符号为〈U+0300–U+036F〉。组合用附加符号亦存在统一码中的多个区块。在统一码中,附加符号总是加在主要字符之后。因此,有可能加入多个附加符号。直到2006年,只有少数软件能正确显示此类组合。

OpenType

编辑

OpenType则有ccmp功能标签,以定义字形是由其它组合字符所组合出来或可分解之,另有mark标签用以将组合字符叠加于基本字符,以及mkmk标签用以组合字符彼此之间的组合。

统一码范围

编辑
组合附加符号
Combining Diacritical Marks
[1]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x ◌̀ ◌́ ◌̂ ◌̃ ◌̄ ◌̅ ◌̆ ◌̇ ◌̈ ◌̉ ◌̊ ◌̋ ◌̌ ◌̍ ◌̎ ◌̏
U+031x ◌̐ ◌̑ ◌̒ ◌̓ ◌̔ ◌̕ ◌̖ ◌̗ ◌̘ ◌̙ ◌̚ ◌̛ ◌̜ ◌̝ ◌̞ ◌̟
U+032x ◌̠ ◌̡ ◌̢ ◌̣ ◌̤ ◌̥ ◌̦ ◌̧ ◌̨ ◌̩ ◌̪ ◌̫ ◌̬ ◌̭ ◌̮ ◌̯
U+033x ◌̰ ◌̱ ◌̲ ◌̳ ◌̴ ◌̵ ◌̶ ◌̷ ◌̸ ◌̹ ◌̺ ◌̻ ◌̼ ◌̽ ◌̾ ◌̿
U+034x ◌̀ ◌́ ◌͂ ◌̓ ◌̈́ ◌ͅ ◌͆ ◌͇ ◌͈ ◌͉ ◌͊ ◌͋ ◌͌ ◌͍ ◌͎  CGJ 
U+035x ◌͐ ◌͑ ◌͒ ◌͓ ◌͔ ◌͕ ◌͖ ◌͗ ◌͘ ◌͙ ◌͚ ◌͛ ◌͜◌ ◌͝◌ ◌͞◌ ◌͟◌
U+036x ◌͠◌ ◌͡◌ ◌͢◌ ◌ͣ ◌ͤ ◌ͥ ◌ͦ ◌ͧ ◌ͨ ◌ͩ ◌ͪ ◌ͫ ◌ͬ ◌ͭ ◌ͮ ◌ͯ
注释
1.^ 依据 Unicode 14.0

码点U+0346–034A为国际音标符号:

  • U+0346  ͆唇齿化
  • U+0347  ͇齿龈音
  • U+0348  ͈强音
  • U+0349  ͉ :弱音
  • U+034A  ͊去鼻音化

码点U+034B–034E用于言语障碍国际音标附加符号

  • U+034B  ͋ :鼻腔泄气
  • U+034C  ͌ :腭咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
组合附加符号扩展
Combining Diacritical Marks Extended
[1][2]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1ABx ◌᪰ ◌᪱ ◌᪲ ◌᪳ ◌᪴ ◌᪵ ◌᪶ ◌᪷ ◌᪸ ◌᪹ ◌᪺ ◌᪻ ◌᪼ ◌᪽ ◌᪾ ◌ᪿ
U+1ACx ◌ᫀ
U+1ADx
U+1AEx
U+1AFx
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
组合附加符号补充
Combining Diacritical Marks Supplement
[1][2]
Unicode Consortium 官方码表(PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx ◌᷀ ◌᷁ ◌᷂ ◌᷃ ◌᷄ ◌᷅ ◌᷆ ◌᷇ ◌᷈ ◌᷉ ◌᷊ ◌᷋ ◌᷌ ◌᷍ ◌᷎ ◌᷏
U+1DDx ◌᷐ ◌᷑ ◌᷒ ◌ᷓ ◌ᷔ ◌ᷕ ◌ᷖ ◌ᷗ ◌ᷘ ◌ᷙ ◌ᷚ ◌ᷛ ◌ᷜ ◌ᷝ ◌ᷞ ◌ᷟ
U+1DEx ◌ᷠ ◌ᷡ ◌ᷢ ◌ᷣ ◌ᷤ ◌ᷥ ◌ᷦ ◌ᷧ ◌ᷨ ◌ᷩ ◌ᷪ ◌ᷫ ◌ᷬ ◌ᷭ ◌ᷮ ◌ᷯ
U+1DFx ◌ᷰ ◌ᷱ ◌ᷲ ◌ᷳ ◌ᷴ ◌᷵ ◌᷶ ◌᷷ ◌᷸ ◌᷹ ◌᷻ ◌᷼ ◌᷽ ◌᷾ ◌᷿
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
符号用组合附加符号
Combining Diacritical Marks for Symbols[1][2]
Unicode Consortium 官方码表 (PDF)
0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx ◌⃐ ◌⃑ ◌⃒ ◌⃓ ◌⃔ ◌⃕ ◌⃖ ◌⃗ ◌⃘ ◌⃙ ◌⃚ ◌⃛ ◌⃜ ◌⃝ ◌⃞ ◌⃟
U+20Ex ◌⃠ ◌⃡ ◌⃢ ◌⃣ ◌⃤ ◌⃥ ◌⃦ ◌⃧ ◌⃨ ◌⃩ ◌⃪ ◌⃫ ◌⃬ ◌⃭ ◌⃮ ◌⃯
U+20Fx ◌⃰
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
组合半符号
Combining Half Marks[1]
Unicode Consortium 官方码表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x ◌︠ ◌︡ ◌︢ ◌︣ ◌︤ ◌︥ ◌︦ ◌︧ ◌︨ ◌︩ ◌︪ ◌︫ ◌︬ ◌︭ ◌︮ ◌︯
注释
1.^ 依据 Unicode 13.0

注释

编辑
  1. ^ Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. ^ 例如,当在做windows-1258和越南信息交换标准代码之间的转换时,前者使用组合字符而后者使用大量预组字符。转换器若只是单纯地与统一码做转换,则会导致混乱。
  3. ^ Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  4. ^ Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  5. ^ 5.0 5.1 5.2 5.3 Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.

参见

编辑

外部链接

编辑