空格

標點符號

空格是行文為防止混淆或有特定用途的空位。古代中文在書寫上一般不用標點[1],字與字之間亦無空格。空格通常作特定用途,如每起首須縮入兩個字位[2]尊稱前要留空一格作挪抬等等。

 
空格
一般标点符号
撇号  '
括号 [ ]  ( )  { }  ⟨ ⟩  ( )
冒号 :
逗號  ,  ،  
頓號
连接号 ‒  –  —  ―    
破折号      ——
省略号  ...      
叹号  !
句号  .
书名号 ‹ ›  « »  《 》  ﹏ ︴
专名号 _  
连字号
連字暨減號 -
问号  ?
引号 ‘ ’  “ ”  ' '  " "  「 」『 』
分號 ;  
斜線 /    
着重号
示亡号  ‌
隐讳号 ×
分字符
间隔号 ·
空格     
一般排版符號
和號 &
星號 *
@ @
井號 #
數字符號
反斜线 \
等号 =
倒感嘆號 ¡
倒問號 ¿
乘号 ×
除号 ÷
序數標識 º ª
百分號 %
千分號
萬分號
加號減號 + −
正負號負正號 ± ∓
度數符號 °
角分符号    
段落符号  //  
豎線 |    ¦
分节符号 §
參考標記
項目符號
脱字符 ^
波浪號 ~
上橫線
下橫線 _
虚缺号
剑標 † ‡ ⹋
同上符号
知識產權符號
版权符号 ©
copyleft
錄音版權符號英语Sound recording copyright symbol
註冊商標符號 ®
服務商標
商标符号
貨幣
國際貨幣符號 ¤

؋฿¢英语Brazilian cruzeiro$֏ƒ英语Florin sign英语Philippine peso sign£英语Ruble sign英语Indian rupee sign 英语Shekel sign圓 圆 円 元 ¥

特殊排版符號
三星符号英语Asterism (typography)
花型英语Fleuron (typography)
标示号
疑问惊叹号
反諷號英语irony punctuation
菱形
延音线
相關符號
  • 空白字元
其他語言標點符號

歐洲语言

编辑

拉丁语族日耳曼语族的语言中,字與字之間以及標點符號與其後的字之間會以空格作間隔。在句號後面,一般以一個空格與其後的字分隔,這種分隔稱為「法式分隔」。[3] 有時候在處理文書上,會在句號後以兩個空格作間隔,這種分隔稱為「英式分隔」。

東亞语言

编辑

在東亞语言裡,空格運用的程度有異。中文日文比較少在文書上使用空格,而日文會在正式場合裡在人名上運用空格,以分隔姓氏名字。在韓文,書寫的時候運用大量的空格,稱為「隔寫法」(韓文:띄어쓰기)。韓文的隔寫法有標點符號的作用。比如說「아버지가방에들어가신다.」這個句子會因不同的隔寫方式,而有不同的意思:

  • 아버지가 방에 들어가신다.(爸爸進房間去了。)
  • 아버지 가방에 들어가신다.(爸爸進提包裡去了。)

中文排版

编辑

在使用中文電腦初期,文書處理及網頁編輯工具大多改自英文軟體,與BIG5編碼並不完全相容;英文ASCII字元編碼為1byte、中文BIG5則是2byte,假使邊界或斷行排版沒設定好,不足容納中文字時會造成該字或整段亂碼,因此比照英文排版在各字間加半形空格(多出1byte緩衝)以避開程式錯誤

及至中文文書和網頁編輯軟體發展成熟後,不再產生亂碼情形,也就無須在字間加空格。少數香港媒體新聞網頁直到2010年代初,如香港電台當時還維持早期排版方式[4]

Unicode定義

编辑
 
Unicode中的各种空格

Unicode定義了大量空格符號,列表如下:

Unicode定義之空格字元
編碼 不換行 用于URL HTML 名稱 區域 顯示
U+0009 文字制表符(Character Tabulation) 基本拉丁文
ASCII字元0x09
U+0020 空格 基本拉丁文
普通半形空格,同ASCII字元0x20
U+00A0   不換行空格(No-Break Space) Latin-1 Supplement  
同U+0020,但不換行
U+1680 歐甘空格(Ogham Space Mark) 歐甘字母
用於分隔歐甘文單詞。通常情況下顯示為一條直線,而在沒有字干的字型中會顯示成空格。需要歐甘文字型。
U+180E 蒙古文元音分隔符(Mongolian Vowel Separator,MVS) 蒙古文
作用近似不換行空格,用於蒙古文時使得詞尾兩個字母呈現不同的字形。自Unicode 6.3.0起不再定義為空格。
U+2002   En空格(En Space)或Nut 通用標點
en同寬(em之一半)。
U+2003   Em空格(Em Space)或Mutton 通用標點
與em同寬。
U+2004   Em三分之一空格(Three-Per-Em Space)或Thick Space 通用標點
em之三分之一寬
U+2005   Em四分之一空格(Four-Per-Em Space)或Mid Space 通用標點
em之四分之一寬
U+2006 Em六分之一空格(Six-Per-Em Space) 通用標點
em之六分之一寬。電腦字型有時與U+2009等同。
U+2007   數字空格(Figure Space) 通用標點
用於分隔數字之定位符,與單一數字同寬
U+2008 標點空格 通用標點
與同字型之窄標點同寬,即句號或逗號(西方語文)之寬度[5]
U+2009   窄空格(Thin Space) 通用標點
em之六分之一(有時設計成五分之一)寬。建議用作SI單位數字之千位分隔符。與U+2002至U+2008不同,其寬可根據排版調整[6]
U+200A 髮寬空格(Hair Space) 通用標點
窄於窄空格(thin space)
U+200B 零寬空格(Zero Width Space,簡稱「ZWSP」) 通用標點
U+200C ‌ 零宽不连字(Zero Width Non Joiner,簡稱「ZWNJ」) 通用標點
U+200D ‍ 零宽连字(Zero Width Joiner,簡稱「ZWJ」) 通用標點
U+202F 窄式不換行空格(Narrow No-Break Space) 通用標點
作用近似U+00A0不換行空格。用於蒙古文時寬度通常為普通空格三分之一,用於其他文字時寬度有時相當於U+2009窄空格。
U+205F 中數學空格(Medium Mathematical Space,簡稱「MMSP」) 通用標點
用於數學方程式。em之18分之4寬[7]在數學排版領域,空格寬度通常以十八份之幾的方式給定;4/18 em可用於數個情況,例如數式a + ba++b之間[8]
U+2060 文字連接符(Word Joiner) 通用標點
同U+200B,但該處不能換行。Unicode 3.2新增,以代替U+FEFF字元廢止之零寬不换行空格功能
U+3000 表意文字空格 CJK符號及標點  
與CJK文字同寬(全形
U+FEFF 零寬不换行空格(Zero Width No-Break Space) = 位元組順序記號(Byte Order Mark,簡稱「BOM」) Arabic Presentation Forms-B 
主要用作位元組次序標記字元。原來之不換行指示功能於Unicode 3.2起廢止,代之以U+2060。

Unicode在控制图形(Control Pictures)區域亦提供一些具像字元用來代表空格,例如(Symbol For Space,U+2420)、(Blank Symbol,U+2422)和(Open Box,U+2423)[9]。有些文書處理軟件如Microsoft Word會使用间隔号·代表半形空格。

注釋

编辑
  1. ^ 御定康熙字典 (四庫全書本)/卷28#讀: "又集韻韻㑹 𡘋大透切音豆義同 周禮天官小宰宮正註鄭司農讀火絶之徐音豆 又增韻句讀凡經書成文語絶處謂之句 語未絶而點分之以便誦詠謂之讀 今祕省挍書式凡句絶則點於字之旁 讀分則微點於字之中閒";可見直到清朝時書寫習慣都不加標點,研究解讀時才另加標記輔助。
    詳見标点符号#歷史, 古人書寫實物見: 蘭亭集序
    《漢典》:句讀页面存档备份,存于互联网档案馆
  2. ^ 沿自1919年胡適周作人錢玄同等向中華民國教育部提出《請頒行新式標點符號議案(修正案)》存档副本. [2010-09-30]. (原始内容存档于2009-12-13). [1]页面存档备份,存于互联网档案馆
  3. ^ Einsohn, Amy. Punctuation, Eyeballing every mark. The Copyeditor's Handbook: A Guide for Book Publishing and Corporate Communications 2nd. Berkeley, Los Angeles, London: University of California Press. 2006: 113 [2010-04-25]. ISBN 9780520246881. If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon ... 
  4. ^ 天文台明日考慮需否發三號強風信號. 香港電台. 2012-07-21 [2012-07-22]. (原始内容存档于2013-04-30) (中文(香港)). 
  5. ^ Character design standards - space characters. Character design standards. Microsoft. 1998–1999 [2009-05-18]. (原始内容存档于2018-01-09). 
  6. ^ The Unicode Standard 5.0, printed edition, p.205
  7. ^ General Punctuation (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008 [2009-05-13]. (原始内容存档 (PDF)于2011-09-17). 
  8. ^ Sargent, Murray III. Unicode Nearly Plain Text Encoding of Mathematics (Version 2). Unicode Technical Note #28. Unicode Inc: 19–20. 2006-08-29 [2009-05-19]. (原始内容存档于2021-03-08). 
  9. ^ Control Pictures (PDF). Unicode, Inc. [2017-03-06]. (原始内容存档 (PDF)于2021-04-20). 

延伸閲讀

编辑

另見

编辑