维基百科:繁简处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科裡,繁简处理和地区词处理是字词转换系统的两大组成部分。繁简转换旨在为用户提供只针对单字的转换(并包括繁简/简繁一对多的转换,例如簡體「打斗」會正確轉成繁體「打鬥」),是进一步实现地区词转换的基础。本页面提出一些繁简转换编辑维护的指引。
维基百科简体字与繁体字的转换,是指中华人民共和国所制定规范汉字与华语圈传统汉字间的转换,转换范围基本以《通用规范汉字表》为准,但亦会根据民间习惯和实际需要作弹性调整。
全局转换
维基百科的繁简转换总共通过三个转换表来实现:其一是MediaWiki内置的转换表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定义的简体中文转换表、其三是在MediaWiki:Conversiontable/zh-hant中定义的繁体中文转换表。
如果您遇到了以下三种情况,请提交Wikipedia:字词全局转换修复请求,管理员会尽快处理,而无需人手转换修复:
- 繁简/简繁一对多的转换出错。例:「乾隆」过度转成「干隆」(由于“繁体:乾=>简体:乾、干”的一对多转换);
- 全局转换地区词出错。例:“東加拿大”过度转成“汤加拿大”(由于“臺灣正體:東加=>大陆简体:汤加”的地区词全局转换),“撒贝宁”过度转成“撒貝南”(由于“大陆简体:贝宁=>臺灣正體:貝南”的地区词全局转换);
- 某一单字没有转换。例:“東”未转成“东”,但此种情况较为罕见。
注意事项
条目标题
用繁体或简体建立页面,相应标题必须全部为繁体或简体字。如果标题繁简混杂,例如「中國历史」,系统就无法自动转换。如果您发现这些页面,请将它移动到简体标题或繁体标题,然后将重定向页面挂上{{d|R3}}
标签;但系統會視作簡體字的傳承字、俗字(如「杰」、「灯」)除外(是否為簡體字應視具體情況而定)。
如果文章有繁简两版本就必須合并,具体参见Help:中文维基百科的繁简、地区词处理#編輯一般文章時的注意事項。通常這些情況很少見,維基程式會自動在你建立條目時判斷有無對應繁簡的條目並做出處理,但通過移動等方式也會產生同一事物的繁簡兩個版本條目。
若页面已有繁中标题版,則不得建立相同内容的简中标题页面,反之亦然。例如,条目哈萨克已存在,則不得建立名為哈薩克的条目,但可以建立繁简重定向至哈萨克条目。
勿与地区词转换相混淆
虽然繁简转换与地区词转换都用相同的转换技术,但它们发挥的功能并不一样,因此,请勿将地区词的全局转换请求提交到Wikipedia:繁简体转换请求。如需了解更多相关内容,请参见Wikipedia:地区词处理。
勿人手转换条目繁简语句
编辑维基百科条目时,如果缺乏正当理由,请勿人手将条目源码的繁体语句转为简体,反之亦然(广义也包括将一个地区用词转换成另一地区用词,如港澳繁体转换成臺灣正體),以免影响他人编辑和阅读。人手转换可能會视为“繁简破坏”,见Wikipedia:破坏#破坏类型中的“繁简、异体及地区用词破坏”一条。
对于读者来说,想只看繁体或简体,可以在界面上方选择“大陆简体”、“香港繁體”、“澳門繁體”、“大马简体”、“新加坡简体”或“臺灣正體”;对编者来说,若想修正自動转换出錯的词汇,可以使用人手转换语法,形如-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-
,或者{{NoteTA}}模板。总之人手转换条目繁简语句没有必要。
请注意:若您的浏览器安装了中文繁简转换软件,或可以转换繁简中文的移动應用程式,请在编辑时将其关闭或移除。
簡便地修復錯誤的繁簡轉換
一種例外是當繁簡並非一對一轉換,且該字不與上下文形成詞彙而不適宜使用全文轉換時,為了簡便地修復錯誤的繁簡轉換,可改為不會轉換出錯的字眼。修復錯誤轉換時,應優先使用沒有歧義且不會轉換錯誤的字形。例如在簡體和港澳繁體有「着」「著」兩種字形,在臺灣正體只有「著」字形,在原始碼輸入「着」時可由系統自動轉換成臺灣正體「著」,但反之則不會轉換,因此以台灣正體輸入「吸著」一詞時無法正確轉換為簡體和港澳繁體,此時容許直接將原始碼修正為「吸着」以修正轉換錯誤,如果在內文直接使用轉換規則(例如「吸-{zh-hans:着; zh-hk:着;zh-tw:著;}-」)時,也允許將原始碼簡化為「吸着」。更詳細的範例可參考Wikipedia:非一對一字詞轉換錯誤修正指南。
勿手動轉換異體字
儘管異體字間的功能相近,且所代表的意義相同,但手動轉換異體字,很可能引發編輯爭議,甚至引起編輯戰。因此在人手转换异体字之前,请先考虑以下两种情况:
一是在现代汉语中或者电脑输入中已经不再使用或者极少使用的异体字,如「靑/青」「敎/教」「囯/国國」,这种情况下,将异体字转换为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。
二是目前现代汉语中仍然有用的异体字,此类异体字由于較常用,或者是不同地区,对正体是哪个字的定义不同,例如「床/牀」,中国大陆和台湾把「床」视为正体,把「牀」视为异体,而香港则是相反,视「牀」为正体,人手转换此类异体字违反了避免地域中心方針。此外,「台/臺」这一对字由于政治原因常常成为修改对象,由于「台」字虽为俗写,但是在台湾已经广泛使用,因此不应人手转换,而是应该遵循先到先得的原则,因为人手转换这些字对条目没有实际改善作用。
概括来讲:
- 如果所有地区皆常用甲,罕用乙→可将源码乙直接改为甲,不宜使用转换。
- 如果某些地区常用甲而罕用乙,某些地区常用乙而罕用甲→源码文字先到先得,不得修改,同时全局转换。
- 如果所有地区混用甲/乙→源码文字先到先得,不得修改,不得使用转换。
- 如果某些地区混用甲/乙,其他地区常用甲而罕用乙→源码文字先到先得,不得修改,其他地区可使用转换。
日本漢字及其他不應轉換繁簡的情形
因為日本漢字不屬於中文,所以日本漢字不应參與中文的繁簡轉換。但是,部分日本漢字與中文汉字存在重疊,系統可能误将其认作中文而轉換。这种情况下,您应当使用{{lang|ja|日本語漢字}}
來防止誤轉。
如果是因为其他原因需要避免简繁转换(如在一些网站,简体和繁体的用户名屬於不同账号),可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
来达到禁止转换的效果。在使用cite系列模板标记参考来源时,遇日文汉字可使用|script-title=ja:XXX
展示来源标题。(韩文汉字情况同理,使用|script-title=ko:XXX
展示来源标题。)
大陆简体模式下的中国古代专有名词
在大陆简体模式下,对中国古代人名、地名等专有名词,若其中某一简化字属于两个或多个汉字的合并字,则该字可以保留原繁体字或异体字,如“凌濛初”可不简化作“凌蒙初”、“南壄”可不简化作“南野”、“昇平”可不简化作“升平”。若某一繁/异体字本身已在简体中文环境较常出现(如“濛”字),则该字本身便不应加入全局繁简转换(或应从已在的全局转换中移除);否则,对其中繁/异体字会被转换的专名而言,若通用度高可在全局转换进行相关处理以防被转换为简化字[註 1],其他情况则一般只在页面内手工转换或加入相关公共转换组。在条目内(尤其是以该专名为主题的条目)首次出现时,这些保留繁/异体字的专名须标注简化字写法。
注释
- ^ 这里说的“通用度”有两层含义,既包括了“简体中文环境下该专名繁/异体字写法出现的普遍程度”,也包括了“在中文维基百科出现的频率”,均高者称“通用度”高。
外部連結
- 《通用規範漢字表》(2013年08月19日发布,中国大陆用字规范)