基本拉丁字母 (Unicode區段)

基本拉丁字母Basic Latin),又稱C0控制字符及基本拉丁字母C0 Controls and Basic Latin),是Unicode標準下的首個Unicode區段,亦是唯一一個在UTF-8下,以單一字節編碼的區段。此區段包含ASCII編碼下所有字母英语ISO basic Latin alphabet控制字符。該區段的範圍為U+0000..U+007F(共128個字元),包含C0控制字符、ASCII标点符号規約符號ASCII數字英文字母中的大寫小寫字母,以及一個控制字元。

C0控制字符及基本拉丁字母
C0 Controls and Basic Latin
範圍U+0000..U+007F
(128個碼位)
平面基本多文種平面BMP
文字拉丁字母(52個)
通用(76個)
應用
符號系列
已分配128個碼位
33個控制或格式
未分配0個保留碼位
來源標準ISO/IEC 8859 · ISO 646
註釋[1][2]

基本拉丁字母區段內的字元Unicode標準的1.0版本起一直沿用至今,多年來未曾對此作出任何增減。[3]該區段在1.0版本的名稱為ASCII[4]

字符表 编辑

下表列出基本拉丁字母包含的所有字符[5]

子標題 编辑

「C0控制字符及基本拉丁字母」區段內包含六個子標題。[5]

C0控制字符 编辑

「C0控制字符」(C0 Controls,於1.0版本中稱為C0 ASCII控制符)乃繼承自ASCII及其他7位元及8位元編碼系統。C0控制字符的別名乃基於ISO/IEC 6429:1992標準而取。[5]

ASCII標點及符號 编辑

此子標題乃指標準標點字元、簡單數學運算子,以及比索符號($)、百分號、&符號、下劃線和管道符號等符號。[5]

ASCII數字 编辑

「ASCII數字」(ASCII Digits)子標題包含標準歐式數字字元1-9及0。[5]

大寫拉丁字母 编辑

「大寫拉丁字母」(Uppercase Latin alphabet)子標題包含26個標準、無附加符號的大寫拉丁字母。[5]

小寫拉丁字母 编辑

「小寫拉丁字母」(Lowercase Latin alphabet)子標題包含26個標準、無附加符號的小寫拉丁字母。[5]

控制字元 编辑

「控制字元」(Control Character)子標題僅包含「刪除」字元。[5]

符號、字母與控制符數量 编辑

下表列出C0控制字符及基本拉丁字母區段中,各子標題的字母、符號與控制符數量。

子標題名稱 符號數量 字元代碼範圍
C0控制字符 32個控制字符 U+0000..U+001F
ASCII標點及符號 33個標點符號與符號 U+0020..U+002FU+003A..U+0040U+005B..U+0060U+007B..U+007E
ASCII數字 10個數字 U+0030..U+0039
大寫拉丁字母 26個無附加符號的大寫拉丁字母 U+0041..U+005A
小寫拉丁字母 26個無附加符號的小寫拉丁字母 U+0061..U+007A
控制字元 1個包含「刪除」字元的控制字符 U+007F

區塊 编辑

C0控制字符和基本拉丁字母
C0 Controls and Basic Latin[1]
Unicode Consortium 官方碼表 (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+000x  NUL   SOH   STX   ETX   EOT   ENQ   ACK   BEL    BS     HT     LF     VT     FF     CR     SO     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   CAN    EM    SUB   ESC    FS     GS     RS     US  
U+002x   SP   ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A B C D E F G H I J K L M N O
U+005x P Q R S T U V W X Y Z [ \ ] ^ _
U+006x ` a b c d e f g h i j k l m n o
U+007x p q r s t u v w x y z { | } ~  DEL 
註釋
1.^ 依據 Unicode 14.0

變體 编辑

部份字元若跟從變體指示器(variant indicators),則會以標準化變體的定義生成。

區段內亦有一個為字元「0」定義、帶有短對角斜線的變體0︀U+0030 DIGIT ZERO U+FE00 VS1)。[7][8]

12個字元可透過U+FE0E VS15U+FE0F VS16以生成繪文字變體。[9][10][11][12]它們均為鍵帽英语Keycap基底字符(base characters),如#️⃣(U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP)。VS15版本是「文字樣式」,而VS16版本則為「繪文字樣式」。[8]

繪文字可選變體
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
基本碼位 # * 0 1 2 3 4 5 6 7 8 9
基本+VS15+鍵帽 #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
基本+VS16+鍵帽 #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

歷史 编辑

以下与Unicode相关的文档记录了在基本拉丁字母区块中定义特定字符的目的和过程:

參見 编辑

注釋 编辑

  1. ^ 縮寫為EXC
  2. ^ 縮寫為QUO
  3. ^ 縮寫為DEL

參考資料 编辑

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25) (英语). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29) (英语). 
  3. ^ The Unicode Standard Version 1.0, Volume 1. Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1. 
  4. ^ 3.8: Block-by-Block Charts (PDF). The Unicode Standard. version 1.0. Unicode Consortium. [2022-05-17]. (原始内容 (PDF)存档于2021-02-11) (英语). 
  5. ^ 5.0 5.1 5.2 5.3 5.4 5.5 5.6 5.7 Unicode 6.2 code charts (PDF). The Unicode Standard. [2013-04-01]. (原始内容 (PDF)存档于2018-07-04) (英语). 
  6. ^ Michael S. Kaplan. When is a backslash not a backslash?. Sorting it all Out. Microsoft. 2005-09-17. (原始内容存档于2010-06-12) (美国英语).  亦可於 http://archives.miloush.net/michkap/archive/2005/09/17/469941.html页面存档备份,存于互联网档案馆) 查閱。
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray. L2/15-268: Proposal to Represent the Slashed Zero Variant of Empty Set (PDF). 2015-10-30 [2022-05-17]. (原始内容 (PDF)存档于2016-10-21) (英语). 
  8. ^ 8.0 8.1 UTS #51 Emoji Variation Sequences. The Unicode Consortium. [2022-05-17]. (原始内容存档于2022-03-31) (英语). 
  9. ^ Edberg, Peter. L2/11-438: Emoji Variation Sequences (Revision of L2/11-429) (PDF). 2011-12-22 [2022-05-17]. (原始内容 (PDF)存档于2022-06-10) (英语). 
  10. ^ Pournader, Roozbeh. L2/15-301: A proposal for 278 standardized variation sequences for emoji (PDF). 2015-11-01 [2022-05-17]. (原始内容 (PDF)存档于2022-03-31) (英语). 
  11. ^ UTR #51: Unicode Emoji. Unicode Consortium. 2020-02-11 [2022-05-17]. (原始内容存档于2019-05-01) (英语). 
  12. ^ UCD: Emoji Data for UTR #51. Unicode Consortium. 2021-08-26 [2022-05-17]. (原始内容存档于2022-03-28) (英语).