维基百科:关于改革字体、地区词转换功能的调查

字词转换
主页 讨论
轉換請求
错误修复请求
地区词候选
轉換介紹
字詞轉換處理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共轉換組 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工轉換 讨论
  高级语法 讨论
  用字模式选择说明
相關模板
NoteTA 全文字詞轉換
CGroup 公共轉換組列表
Lan 界面文字轉換
地区用词 地區詞模板
地区用词2 進階地區詞模板
各地中文名 地區用詞資訊框
查看 - 讨论 - 编辑 - 变动

最新更改

编辑
  • 共识的第一条按照意见修改了一下
  • 共识的第二条按照意见修改了一下
  • 比较详细的技术策略出炉了

动态监视

编辑
Wikipedia:繁简处理
最后版本 Srr第一步:改寫Wikipedia:繁简处理修改
Wikipedia:繁简体转换请求
最后版本 Srr第一步:改寫Wikipedia:繁简处理修改

背景

编辑

中文维基的Wikipedia:繁简处理问题是历史问题,出自繁简两个版本的合并过程。在这个过程中,制定了繁简转换表使得繁简字体转换实现了相当的自动化,深受欢迎。然而,一些地区词造成的同义词分歧(打印机、印表機)仍然没有得到解决,因此中文维基采用了一个值得质疑的策略,就是用繁简转换器的词替换功能来同时实现繁、简体版之间的同义词替换。不料,繁体的常规使用者还至少分港台用户两种,内部依然存在同义词分歧,于是使用繁简体转换器的超载词替换功能,發展出除簡體(zh-cn,其實是中國大陸簡體)及繁體(zh-hant)外的三個字詞轉換表:台灣正體(zh-tw)、香港繁體(zh-hk)、新加坡簡體(zh-sg)。

2006年11月左右,港澳繁体(zh-hk)標籤在依投票結果新增在頁頂,而台湾正体(zh-tw)標籤則代替了原來的繁体(zh-tw)標籤,但這繁体版事實上在未登入下被預設為使用zh-tw,因此只是名字上的變更。故此,實際上對於繁體版的註冊用戶港澳繁体版和台湾正体早已在參數設置中設有。不久,马新简体也被提出要求顯示在頁頂標籤中,自此在頁頂多了大陆简体以外的簡體選擇。目前,中文维基百科一共有六种版本,除上述五种版本,还有源文件作为不转换(zh)的第六种版本,而繁體(zh-hant)一直還在頁頂標籤中隱藏著。

问题

编辑

虽然港澳繁体版建立之前有过一次投票,那次投票的局限性和操作方式意味着许多制造出来的问题没有讨论也没有解决。争论得最激烈的问题不外乎于中文维基是否应该有多种版本。虽然Wikipedia:繁简处理里承认

共识:我们的最终目标是:取消過去的繁简分立体系,每个条目只保留一个版本,并通过电脑程序自动转换繁简体。

但随着用户要求替换的词和词组越来越多、地域针对性越来越强,合并的进程已不存在,“一个版本”的概念也已经模糊,目前只能说每个条目有一个“不转换”的源文件。另一方面,不同的地区确实有一些特殊的习惯用词或官方译词,在维基百科上同时出现时容易产生有关权威问题的政治纠纷。除此之外还有更微妙的众多问题,详见:123

分析

编辑

简体和繁体的转换是纯字体转换,仅仅涉及技术问题。区域词替换则是内容创造和修改的问题。两者的混淆使上述问题复杂化,不透明化,讨论摸不到核心,后果是初衷和结局牛头不对马嘴。字体转换和区域词替换显然是垂直的,因此即使只为了方便管理也有必要在概念上、技术上、届面上把两者区分开来。详见这里

进一步分析

编辑

繁简体转换问题切割开以后,剩下来的区域词分歧可以总结出以下几种类型,大多和外来语有关,但不全是:

  • 非专有名词
    • 偏好分歧
指几种词各区域通用也比较一目了然,仅在使用频率上有别
例:公共汽车词组激光
    • 词义分歧
指字面意思不同或有混淆可能的词语,经常是术语和意译的外语词
例:散列表交流道
  • 专有名词
    • 音译分歧
指音值相似、只是音译规则不同造成了用字分歧
例:马力欧伯克利迈克尔·乔丹
    • 权威分歧
指当事人或组织在各地区使用的正式命名不同(名称、商标),或各地区政府的官方命名不同(地名、人名)。
例:通用电气公司老挝布什

上述分类有少量重叠。

共识

编辑

经过数次讨论,得出以下的观点,希望能成为阶段性的共识:

  • 设立繁简体“公版”,也就是恢复没有地区词替换的源文件繁简体版。

理由:源文件作为中文维基的标准版,需要有方式呈现出无显著地区特征的繁简字体资料。

  • 审查全版本替换表的内容,逐渐脱离对该表的依赖。

理由:全版本替换的技术不成熟,漏洞百出,影响面广,各种改动牵涉太多,所以无法有效维护。同时,由于编辑规则不同于文章(管理员必须介入),常规的“维基过程”失效。是否要保留一小部分的全版本替换词应该商讨一下,但这个表应该慎用,里面的每个词都应该商讨有没有必要全版本转换(即为什么不能用标签达到同样的效果)。

  • 规范内文地区词替换标签的使用原则。

理由:内文替换标签(noteA等)是文章内容的一部分,所以必须接受“维基过程”,包括出现争议时通过讨论来解决(这里的争议包括某篇文章是否用替换标签,在哪里用,用什么词,等等)。制定一些原则可以使这个过程更客观、透明。

阅览Wikipedia:繁简分歧词表是讨论这些问题的良好起点。

  • 制定地区名存亡的标准。

理由:与其给每一个要求的地区一块新版面,或禁止添加新版面,不如用客观标准来决定增加或撤销一个地区名。

实践

编辑

以下是一个界面的建议。简/繁是两个连接,类似以前的简/繁转换连接,通过纯字体转换表把当前显示的页面用全简体或全繁体呈现。工具栏里可以选择地区词的替换。

 

“技术上的问题没想像得那么难,都可以用现有的技术和表完成(某些表需要整理);只要谁授我权,我绝对乐意去实现。举个例子,依照上图,如果用户选择简体,但用台湾区域词替换,自动转变的步骤应该如下:(1)把源文件(也就是“不转换”版的内文)用简转繁纯字体转换转成全繁体(包括内文的所有标签,都一并转换),被特殊escape的段落不转换;(2)从源文里抽取(zh;zh-cn;zh-tw;...)标签,把zh的词选替换成zh-tw的词选,被特殊escape的段落不替换;(3)把第2步的结果用繁转简纯字体转换成全简体。TTTT 07:06 2007年2月2日 (UTC) ”

“目前的转换我问过mountain,有实现繁简与地区分开的基础,但这类改动要小心从事。—自由主義者 ☎ 2007年2月2日10:37 (UTC+8 2月2日18:37) ”

意见

编辑

请表示同意或不同意,并欢迎写下你的意见,或在下面补充其他信息。

(+)贊成改革,我認為情況真的很糟糕,港澳繁體、馬新簡體、台灣正體............再遲一點可能要「台灣本省正體」和「台灣外省正體」,或者「馬」、「新」又是要「宣告獨立」,亂作一團。當然,無可否認的是,地區用字的歧義,有時真的會嚴重影響理解。但是,分得太細緻,只會增加編輯的困難,而且不必要地搞「地區詞」,不利知識傳播。我認為世界上沒十分十美,建議:

  • 應該設「使用內文地區詞替換標籤的常規」,要包括以下數點:
  1. 編者應盡可能使用所有中文社區都能理解的詞彙,盡量避免過份地區化的用語,而有關詞彙可在內文列出參考,但不應該使用「替換標籤」。
  2. 如果原文的詞彙會使某地區的讀者產生「明顯的理解困難」,就可使用「替換標籤」,同時簡略解釋原因。換言之,要是原文詞彙能夠被理解的,即使用字不夠「地區化」,都不需使用「替換標籤」。
  3. 如果同一條目有多組字彙是各地相通的話,則應以條目創建者的字彙為優先使用。
  4. 如出現一些情況,非關理解問題,例如哪一個字彙比較權威、比較政治正確之類,應該透過討論解決,不應以替換功能解決。
  5. 假若有需要使用「內文地區詞替換標籤」,而「地區用詞」本身亦出現爭議時(例如「地區詞彙」亦多個版本的時候),應以討論解決,選取比較常用那的一個。
  • 我相信華文區之間,字彙完全不相通情況並非多數,很多更可以避免,所以我認為只需保留一個「地區用字」標籤就夠,毋須再細分,如果技術可行的話,這個「地區用字」標簽只需在條目裡出現 A 標簽時顯示。只要 A 標籤能識別瀏覽器的設定,要做到地區用字替換並非難事。我認為這是平衡各方意見的做法。Srr 21:44 2007年2月3日 (UTC)Srr 18:25 2007年2月5日 (UTC)

(+)贊成——附和以上意见。守夜者 19:05 2007年2月6日 (UTC)

部份(+)贊成:僅反對「規範內文地區詞替換標籤的使用規則。」,應改為「有爭議時必須經過討論」。現在的維基規則中,沒有規定增加或刪除內容前都需要經過討論,而是經過一輪回退後,應該在討論頁進行討論以尋求共識。因此我認為應改為「有爭議時必須經過討論」。--Jnlin討論) 01:14 2007年2月5日 (UTC)

(+)支持,我覺得地區用詞必定要和字體分開,不然就是只留繁簡體,只使用地區不同用字標籤。但是我覺得替換標籤總是不能不要,臺灣人看到「閃存盤」或香港人看到「計程車」畢竟還是會覺得怪怪的。我是建議較大分歧的地區用句使用用詞替換標籤,而一些地區性不同用字例如里.裡.裏盡量避免輸入,我建議是使用分岐比較小的裡。而且還要定常用字彙清單,總不能讓「天后宮」變成「天後宮」這一類糗事發生。--陋室(亭中茶話) 09:32 2007年2月27日 (UTC)

(-)反对Jnlin之意見。規範內文地區詞替換標籤的常規,不代表毋需經過討論,反而能有所遵從,討論起上來更加有據,如果照Jnlin所講,那麼我們連wp:nc都可以不要了,凡事都在討論頁爭論一番就可以。
我不贊成在中文維基使用地區用字,如果真的想要100%的地道用字,我認為應另立維基。但我要指出在Wikipedia:互助客栈/方针中一個錯誤的論述,就是「英文沒地域中心」(Stewart),英文一樣有地域中心,最起碼有 ArE 跟 BrE 之分,文法不同,用字的拼法也不同,甚至是用另一個字,例如 「mail/post」、「aluminum/aluminium」、「subway/underground」等,但英文維基並沒有所謂「內文地區詞替換標籤」,大家互相包容,沒有人吵著說這是「搞大英語區整合」。當然, ArE 跟 BrE 交流比較多,所以就算寫 aluminum 英國人也會明白,只是習慣上略有不同。我亦十分明白,中文區有一些譯名、用字是全然不同,而且互不通用,的確會產生閱讀的困難,所以內文地區詞替換有實際需要。但我要強調一點,我指的「實際需要」是「當特定地區讀者有理解困難」的時候。
而我認為「使用內文地區詞替換標籤的常規」可先處理(如切實執行,我可參與編寫),因為就算經過Zhconversion.php轉換,但似乎仍然可以透noteA這種「下層」標籤替代。長遠來說,我認為應全面消取Zhconversion.php中所有無關字體的轉換,有需要的話應改用「內文地區詞替換標籤」,這樣可以釐清「繁簡」、「地區用字」的從屬聯係,而且比較有彈性,因為有時「地區用字」根本都沒有統一標準,不少時候都是各說各的,例如馬力歐。加上我要指出,地區詞之間並非mutually exclusive,大家可以交流而互通,如果將地區用字編入Zhconversion.php,當社會文化有所轉變的時候,就難以因時制宜。
致TTTT兄:我認為這樣的分類,有互相重疊的地方,並不能清界定替換規則,所以我認為以「是否各地通用」作為原則,準則例如Google地區搜尋的結果或者主流媒體的用法等。介面設計方面,我認為TTTT提議的和現時的設計,都可以。Srr 08:48 2007年2月5日 (UTC)
那个分类本身不是为了界定替换规则的划分,纯属分析,看怎么把几种情况最大限度拆开。当然你说了用它作为起点也不是不可以,具体说可以建一个分析页面,有分歧词就先讨论属于哪种类型,然后填进去,再按照那种类型的规则行事。TTTT 09:22 2007年2月5日 (UTC)
Srr, 問題在:很多時每一種用字(好 來 塢/ 荷 里 活 , 激 光 /雷 射。。。) 都是「地區用字」,分別只在流通量與流通地。---Hillgentleman | 15:08 2007年2月5日 (UTC)
Hillgentleman, 問題只是你用了地域中心的心態,看那個原本通用的字不順眼,覺得「不對等」而已。但我們寫條目最重要是被所有中文的使用者理解,而不是將文章地域化。我贊成一些根本互不相通的譯名使用替代,例如「宏」和「巨集」。就以你提這兩個做例,我身為香港人,也明白好來塢(這個譯名應是普通話的音譯,香港懂普通話的人不少啊),香港迪士尼也有一間好來塢酒店。而激光和雷射,我想在香港,使用率是不相伯仲。所以我認為兩者都毋須用地區替代,在內文列出就夠了。當然,用不用這功能,就是可以利用常規去討論,維基過程一樣存在,總好過一概而論,為地域化而地域化。Srr 15:43 2007年2月5日 (UTC)
  • 請定義「地域中心心態」。----Hillgentleman | 16:00 2007年2月5日 (UTC)
毋須定義,只是一般的說話,我並不在說維基的「地域中心」方針,這不是我說話的重點。Srr 16:06 2007年2月5日 (UTC)


Srr, 請解釋何謂「地域中心心態」。---Hillgentleman | 16:11 2007年2月5日 (UTC)

Hillgentleman,閣下又不妨解釋一下為何要我解釋一下。請注意,我並非在說wikipedia:避免地域中心,「地域中心心態」不是重點,如果你覺得被冒犯,對不起,但建議你還是回歸正題好吧。Srr 16:23 2007年2月5日 (UTC)
  • Srr, 凡辯論均須開宗明義。已見多人提及「地域中心」;然而大家理解此詞未必同。---Hillgentleman | 16:37 2007年2月5日 (UTC)
如果我要參與你這場詭辯的話,我會說:「請你解釋為何辯論均須開宗明義,並定義何為『開宗明義』。」然後一直詭辯下去。第一、我已經一再說明,我的說話中,「地域中心心態」不是重點,就算將上文「用了地域中心的心態,」完全刪去,也不影響大意。「地域中心」是中文字,你不會不理解吧?我只是用一般人的準標來說,就是以地域的立場思考,總覺得中文維基一定要有地域之分,而不能共同,就是這樣,講不上定不定義,至於維基如何定義「地域中心」,請你問其他人。這是我最後一次回應所謂定義問題,再請你回歸正題。我怕跟你討論是我的一個錯誤。Srr 16:52 2007年2月5日 (UTC)
  • Srr, 有人以為立轉換功能屬地域中心行為,有人認為反對轉換功能屬地域中心心態。若無一確切定義,雙方不能溝通。--Hillgentleman | 16:58 2007年2月5日 (UTC)
Hillgentleman,请见下TTTT 21:10 2007年2月5日 (UTC)。
Srr誤會我的意思了。當然可以對整體適用範圍做限制,但不應該要求加上地區轉換前必須在該條目討論頁討論。--Jnlin討論) 17:20 2007年2月5日 (UTC)
不以為然,為何「不應該要求加上地區轉換前必須在該條目討論頁討論」?最起碼需要解釋原因,提供一些基本証據,處理方法根命名的爭議沒分別。地區詞替換是一個與原文有明顯衝突的改動,正如分拆條目前都需要有所討論,解釋原因。Srr 17:34 2007年2月5日 (UTC)
我觉得你们俩并不存在规范标签用法这一问题上的分歧,只是对修改维基页面应该先讨论还是后讨论有不同的理解。我的理解是,小修改可以先编辑,大修改(篇幅大、影响大、改标题等等)最好先讨论。其实用意就是有理由相信会引起大争议的还是先讨论,不然之后还是会出问题的,但尽量不妨碍大家的修改权,不然就有损开放性了。所以你们都有对的地方。TTTT 20:04 2007年2月5日 (UTC)
補充:例如現在的NPOV政策,若你覺得一個條目POV,則可以貼{{POV}},或是直接把你認為POV的文字改正。我認為轉換也是一樣:若你覺得需要轉換(而且也符合整體適用的範圍)那麼就自行加上,不需在討論頁討論;若你覺得不需要轉換也可以拿掉標籤,若有其他人不同意可以回退,這時就需要在討論頁討論。--Jnlin討論) 17:28 2007年2月5日 (UTC)
掛上POV模板是需要解釋原因的。要除下也是應該在共識之後,正如果我處理油魚的分拆,我不會隨便將標籤拿掉,先商議方案再行動。Srr 17:34 2007年2月5日 (UTC)POV模板清楚寫明:「掛上此模板的編輯者需在討論頁說明本文中立性有爭議的原因。」Srr 17:50 2007年2月5日 (UTC)
  • Srr, NPOV就要求多重觀點。若原文本身為地區用語,再加入另一地用語將更充實。--Hillgentleman | 17:39 2007年2月5日 (UTC)
  • 我不知道你說的「NPOV論點」是指何處,如果你是指User:Jnlin提出的例子,那明顯誤解。他提出的意思是指加入替換時毋須先討論。如果你是指「不用替代功能就是違反NPOV」,這就是一個錯誤。第一、地區用字可透「重定向」連結,各地字眼,甚至沒有地域爭議的不同字眼都可以包容。第二、不用替換功能不代表不能列出地區用字,不同的用語一樣能夠反映,沒有所謂充實不充實的情況。Srr 17:50 2007年2月5日 (UTC)
我來處理POV條目的方式是,若我願意(有能力)改為NPOV,則我會馬上動手(方針「勇敢更新頁面」)並解釋原因;若我沒有能力,我才會掛模板。所以也許我們兩個人解決問題的方式不同,你習慣先討論,而我習慣做了再說。只要每個人都善意假定(這也是方針),那麼我的方法就不會有問題。所以我認為,我們只要抓大方向,真正有問題的轉換一定會有維基人提出並改善,而不需要逐條目去討論,這樣太花時間。--Jnlin討論) 17:58 2007年2月5日 (UTC)
或許這樣說,不一定要討論七日,投票表決,最起提供一些簡單原因,我相信這不算花時間吧?但是,如果連「地區用字」都有爭議,就應該先討論,後修改。我上面的提議依照你建議略略修改了。Srr 18:10 2007年2月5日 (UTC)
接受,但TTTT原本的提議也應該修改。另外,提供原因的地方不只討論頁,在編輯歷史中也可以。--Jnlin討論) 18:15 2007年2月5日 (UTC)
多謝,但你指「TTTT原本的提議」是甚麼?Srr 18:26 2007年2月5日 (UTC)
他指的是第三条。我觉得之前的“规则”一词可能是问题之本,我改了一下。TTTT 20:14 2007年2月5日 (UTC)

我来回应一下Hillgentleman提出的几点看法(“有人认为设转换功能是地域中心,有人认为不设是地域中心”,“对等”)。

  • 第一件事,转换功能本身设不设都无所谓地域中心或其他任何问题,只是技术,我不反对技术,主要看怎么用。
  • 我觉得有必要明确“地域中心”的含义。我们来熟读Wikipedia:避免地域中心里的头一段,最后一句是“看起来好像是客观的文字实际可能已经包含了主观的意念,而这正是与维基的中立观点政策相违。”可见,地域中心的问题从根本上讲是POV(观点、立足点)问题的特殊化,“中立观点”原则也始终指导着这条原则,而不是什么词语对等的原则(事实上维基百科并没有这样的“对等”原则)。说得详细一点,避免地域中心就是避免偏向某一个地区的观点(对比NPOV避免偏向某一个群体),包含避免透过地域色彩的文字(描述、用词等等)暴露特定结论或偏向特定地域看事情的立足点
  • 用词涉及POV的例子很多也很容易理解,比如“打胎/杀胎/人工流产”。但用词(特别是标题)怎么才算涉及地域中心问题?举例,“尖阁岛/钓鱼岛”。必须选一项时有一定的规则和tiebreaker。除了中文维基的FAQ,还有英语维基里的先例和那里讨论留下来的FAQ,毕竟英语维基早就遇到类似问题了。什么用词不涉及地域中心?“打印机/印表机”(但不等于不涉及任何问题,见最后一点)。怎么判断每一个词?很简单,自审,“用词是否影响文章的结论?”如果不影响,就不存在POV,当然更不存在地域中心问题。
  • 再论自动转换能不能解决真正的地域中心问题?答案是不可能的。(英语维基怎么没想到给中国来的IP都显示“钓鱼岛”,给日本来的IP都显示“尖阁岛”?)非但解决不了地域中心问题,还会制造更多,因为转换的潜台词就是推崇地域化不是吗?打个比方,香港版把“香港”转换成“本港”,大陆版把“中国”转换成“我国”,看上去很顺眼嘛,区域用词互相“尊重”不是吗!?再舒服不过了!而这些恰恰就是Wikipedia:避免地域中心里告诫不要用的例子!进一步,谁来防止“大陆”转换成“中国”,“台湾”转换成“中国台北”,甚至“陈水扁祖籍台南”转换成“陈水扁祖籍福建”或“陈水扁祖籍非洲”?怎么处理?现在不是问题以后就不是问题吗?现有的贡献者比较开明不这么做,明日的新贡献者不知道标签的由来只想着制造“本土”版就不会这么做吗?难道界面不需要清理一下,标签的用途不需要规范一下吗?所以才提议,所有的转换必须等同于修改内容,并接受“维基过程”,严防新技术的隐性功能被用来回避一系列维基原则。
  • 有人说,99%的词都和避免地域中心无关联,转换又只会制造地域中心的问题,何必规范它,索性不转换了。但我觉得还是要保留它来服务表意文字的比较特殊的现象,就是在个别页面上存在阅读理解上的困难,特别是术语。虽然没那么严重,但我觉得还是合理的疑义。原则上我同意在这种情况用转换。其他情况的转换我的意见是,反对滥用(POV,frivolous,全版本转换,大段转换,或不经约束的转换),理由很简单,第一:滥用违反维基所有的规则;第二:滥用等于各筑篱笆墙,并促成版面“所有权”归地域“专家”的变相多版面趋势。非滥用又非混淆(比如官方命名差别,习惯用词差别等等)我虽然个人强烈认为没有必要,但原则上不赞成也不反对。TTTT 21:00 2007年2月5日 (UTC)
我認為各方的論點,基本上都已經反映,起碼取得了一些妥協,相信是付諸實行的時候。如果再不做出一個起點來,人走茶涼,想改革就難了。我建議發起投票,先定下「繁簡轉換」和「地域慣用詞彙」的方針。

以下是我建議的工作程序:

  1. 重寫Wikipedia:繁簡處理,並提升為正式方針。重新界定「繁簡轉換是字體上的轉換,除了一些轉換後會出現錯誤的詞彙,例如「打斗」會正確變成「打鬥」外,並不會包含各地域慣用的詞彙替代」,「有關各地域慣用的詞彙替代,應參考Wikipedia:地域慣用詞彙的處理」。
  2. 增設Wikipedia:地域慣用詞彙處理,並投票成為正式方針。主旨:「每個條目使用的字詞,應盡可能被所有中文使用者所理解,而並非以地域分成多過版本。但隨著各地的使用增加,維基發現不同地域,存在一些特殊的慣用和翻譯詞彙,故中文維基設置替代地域詞彙的功能,如果原有條目的詞彙會使某地區的讀者產生明顯的理解困難,便可使用替換功能。換言之,只要原有條目的詞彙能被各地所理解,即使字詞並非地域最慣用的,都不應使用替換功能。」(細則在上方已經達成一些小共識)
只要上兩個方針定下來,隨後的工作就有了根本,易做得多了。
  1. 重新按照TTTT兄的設計,配置介面,並定立「地區標籤」的存亡標準。
  2. 修改Zhconversion.php,變成純字體轉換。
  3. 工程大致完成。

如果我建議得一些認同的話,我就可以開始編撰,之後發起投票表決。Srr 15:50 2007年2月6日 (UTC)

那就请你协助编拟一下。最近我有点忙:原本我想把这篇留在这里供更多人讨论一段时间的,但还是没太多人来发表意见(特别是原来要分地区的创始者们,似乎不感兴趣还是不常上网?),也许成为投票项目后会有更多人来,你就推进吧。TTTT 09:56 2007年2月7日 (UTC)
基本上每一個事項都沒有必要用到投票才能解決問題吧?主要對於修改ZhConversion.php,收集有關的詞彙是花費得最久時間的。在我的轉換系統草稿中有一個草擬中的新轉換方案,待收集足夠的詞彙時,便能透過Bugzilla提出有關中文字詞轉換系統的建議。還有,這個變更不是只只會影響維基百科計劃,而定對MediaWiki軟件作出修改,亦即是會影響到所有中文維基媒體的計劃,同時這個變更亦可以為其它需要語言轉換系統的wiki打下一個基礎,如粵語維基和吳語維基等。--Shinjiman 16:33 2007年2月6日 (UTC)
頭兩項我怕不投票,事後爭議會更大,所以建議定為正式方針。至於Zhconversion.php修改,我明白是最花時間的,我也沒有這些技術能力,所以只能建議放到最後。Srr 16:44 2007年2月6日 (UTC)

其實我一直看不懂,何謂「簡繁公板」。--WiDE 17:00 2007年2月6日 (UTC)

即是「沒有使用地域慣用詞彙替代功能的原版條目」,以供簡繁轉換。Srr 17:09 2007年2月6日 (UTC)
简单来说是“只转换简繁字体,不转换用词”的二个页面。中文的同义词问题以规则解决,我与Ksyrie都设想了一些规则,当然还需要完善。--真實事求是() 10:23 2007年2月7日 (UTC)


「簡繁公板」也就是指,取消系統自動轉換同義詞的意思嗎?--WiDE 03:12 2007年2月10日 (UTC)



(:)回應Srr,你大概看了我這句吧?!「或許華文本身便是一「種族中心」,中文本身就是「地域中心」,一些維基人應該去找英語、世界語這些「沒地域中心」的地方。」不好意思,這句是我的氣語,我有點控制不到情緒。因有提過「華文」一詞有華人的語文的意思,「中文」一詞就是只限中國的語文,我所指的「沒地域中心」看見我加了括號嗎?!事實是反語。
我的主張是的確地區用詞轉換是以地域為主的,但地域中心應該也有分好壞,過份的地域中心我也不支持,故此我們之前在繁簡轉換也出現過爭議,但地區用詞是一種較省時的做法去處理經常出現的不同地區用詞。倒過來,與其每次手工轉換為什麼不自動轉換?!還是你支持不轉換?Stewart~惡龍 10:27 2007年2月7日 (UTC)
我倒想问你,为何一定要设纯地区用词页面?--真實事求是() 10:34 2007年2月7日 (UTC)
看了源码以后我更确信大多转换是不必要的,举个例子,我看到了“方便面”、“速食面”、“泡面”、“即食面”、“快速面”之间的转换和“冷盘”、“冷菜”、“凉菜”之间的转换。动词、名词之间的混淆不说,(我晚上泡面吃=我晚上快速面吃?!),谁告诉我这有任何必要,谁看不懂任何一组请举手。TTTT 13:20 2007年2月7日 (UTC)
惡龍兄:對不起,我的確注意不到這是「反語」,我的理解是:你認為這些不認同轉換的人,是「枉費大家的努力」,是「不切合各地的個別需要」,叫那些人「滾到」(當然有所誇張)英文、世界語這些沒有「地域中心」的維基。我想指出只是:中英文這些應用人口多語言,自然有一些用字分歧,但只有中文維基這樣愈分愈細,愈分愈複雜。(但我亦早說過,中文情況比較有一點特別)我強烈認為,這是中文維基,不是香港維基、星馬維基、大陸維基、台灣維基,我本身反對這些轉換功能,如果維基是我一個人話,我會同意「真實事求事兄」的處理,但有一些維基人指出了一些詞彙差異,的確會明顯影響閱,所以我提出保留這功能,但應該多加規範,沒有需要的話都不使用,僅此而已。
至於將地區用字抽出Zhconversion.php,相信是事在必行,因為如果Zhconversion.php不純正的話,會影響其他mediawiki。Srr 11:23 2007年2月7日 (UTC)
确实有些词汇会影响阅读,你的设想是什么?
我认为这些词汇数目不会太多,而且也不会造成太大困难,以散列表为例,点击入条目问题就解决了,没有必要为此保留地区用词分页,保留了地区用词分页难保以后的维基人不会滥用,且地区分页越来越多的问题没有获得解决,因为其他地区的人也可以此理由要求设立地区用词分页。我认为不过只是同义词的问题,没有这么严重,看不懂的问题被夸大了,看懂看不懂主要在于条目内容写得好不好,不在于同义词。--真實事求是() 10:17 2007年2月8日 (UTC)
若无需「纯地区用词」,那没有必要设地区用词页面,用简繁公版即可。简繁体的转换也需要詞語轉換功能,我没有反詞語轉換功能,我只是认为无需设「纯地区用词页面」而已。--真實事求是() 11:19 2007年2月7日 (UTC)
    • 正如Hillgentleman所說的,真實事求事已長久參與討論,應該知道意圖取消地區用詞轉換機制會遭大多數維基人反對的,這次就以限制地區用詞轉換的數量來達成其目標,甚至多次意圖誤導眾人同異詞數量不多,以說服眾人扼殺他看不順眼的地區用詞轉換機制。可是我們都知道,正因為各地區的不同用詞有礙讀者,強迫讀者接受異地用詞也易起地域中心的爭議,因此在會有zh-tw, zh-hk, zh-sg的出現。意圖取消或限制這行之有效的機制,並強迫讀者接受個別人士定出來的統一用詞,對維基來說不單是一個倒退,更是一種紺制讀者思想的行為,絕對不可得逞。不管怎麼說,地區用詞轉換機制已成定局,然而有人卻總是空口說白話,也不找找以前的討論來看,強指他人已經默認他個人的建議,簡單來說就是偏要找地區用詞轉換機制的麻煩。
      無論如何,地區用詞轉換機制必須存在,也不可以試圖以部分人的主觀意見來挑選哪個用詞應否轉換。繁簡公板是一個很好建議,我非常贊成,但不能因為設立了繁簡公板便取消或限制地區用詞轉換機制。縱觀今後維基的發展,地區用詞轉換機制與繁簡公板並存是事在必行的。 --kknews 14:15 2007年2月9日 (UTC)
  • 同意 kknews 的說法,贊成地區用詞轉換機制與繁簡公板並存。--Jnlin討論) 14:49 2007年2月9日 (UTC)
我很不欣赏kknews的态度,要批评人首先要看清楚他人的论点,我说的是“中文的同义词本来就多,多几个地区用词算得了什么!”,我只是质疑地区用词有异的数量有多少,对阅读造成的困难真的如某些人所说是个严重的问题吗?如果真的是个严重的问题这就奇怪了,要知道对我而言,地区用词完全不成问题,其他人说会面临小问题我能接受,但说是面临严重的问题,非要设立纯地区用词分页不可,这就令我迷糊了,是我的IQ太高,还是某些人的IQ太低,到现在我还是搞不清楚,相信kknews能够为我解答。--真實事求是() 14:51 2007年2月11日 (UTC)

既然无人反对,就继续推行计划

编辑

维基的精神是鼓励以讨论解决事情的,而投票是讨论不出共识时不得已的做法,这点在wikipedia:投票中有说明,现在既然反对者不发表意见,我看等同于默认了,各种计划就继续推行吧,触到痒处他们自会发表意见的,无需顾虑此事。--真實事求是() 15:22 2007年2月8日 (UTC)

  • 真實事求是,你多次重覆同一觀點。已有多人反對。--Hillgentleman | | 2007年02月09日( 五 ), 02:02:03.
我不了解多次重覆同一觀點有何错误?既然有需要重复,那就重复,而且在这里我没有说过同样的话,那是在另外的讨论页说的,这样也算重复?我这里是回应上面TTTT的谈话,他要设投票,我认为不必,是以说明。请给出那一条维基规则列明不可重复观点?若没有相关规则我倒要质疑你为何干涉我的言论自由?
讨论中反对是需要理由的,不是象投票般一句没头没脑的(-)反对就能了事,而且既然反对就在此讨论,若无理可说那问题就在讨论中解决了。TTTT已经集合整理出各种支持简繁公版的观点,以便阅读。我觉得支持纯地区用词分页者也应该这样做,难道要人到处寻找翻出之前的论点吗?你们不是很照顾读者的吗?--真實事求是() 10:03 2007年2月9日 (UTC)

User:真實事求是不要在討論的中間插入全新的章節。另外上面所列的辦法裡,地區標籤的退場機制不見完備、地區標籤刪除後會對用詞轉換標籤(如{{noteA}})造成什麼影響等,都應該詳細說明。另外,地區用詞必然會存在,關於地區標籤和簡正/繁體標籤的共識中也多次論及,只要沒有完善的解決辦法,就不應該貿然行動。--RalfX) 04:14 2007年2月9日 (UTC)

这不是全新,完全无关的章節,而是看到上面TTTT认为需要设投票而做出的解释,另开章节也是为了避免与其他的讨论混杂在一起,弄乱了焦点,也请列明到底那一条维基规则有说不可列全新章节?如果没有我质疑你干涉我的言论自由。既然有反对意见,为何不在此讨论,我怀疑你们要以不理不睬的态度让事情不了了之,这是非常恶劣的。--真實事求是() 10:03 2007年2月9日 (UTC)
我十分理解你意見和擔心,但焦急都無補於事,逕自行事,事後只會被扯後腿,況且系統方面未有定案,更莫說測試,急也不在一時。至於會否不了了之,就要大家努力為討論「保溫」!Srr 18:23 2007年2月9日 (UTC)
确实急不来,现在看来事情已上轨道,以后的讨论可能会往细节发展,我现实工作繁忙,难以进行详细的讨论,以后将专心我的工作,较少上来这里。--真實事求是() 14:51 2007年2月11日 (UTC)
既然為了避免與其他討論混在一起,即應該在底下加上新的留言。您在他人討論中插入章節的行為和目的互相矛盾。--RalfX) 03:14 2007年2月10日 (UTC)
我在意见区底下加上章節,而没有插入,另开章節更不容易混淆,行為和目的没有互相矛盾。我的原意真的只是不想把好好的讨论搞混,弄乱焦点而已。--真實事求是() 14:51 2007年2月11日 (UTC)

現在的共識應該是TTTT兄提出的四點吧。就我的認知中,這個共識並不刪除地區標籤,只是跟繁簡體轉換分開。現在要討論的應該是地區標籤的增加與移除規則,以及規定使用何時可以在條目內文中使用用詞轉換標籤(如{{noteA}})。使用用詞轉換標籤的大原則Srr兄已經列出。--Jnlin討論) 14:44 2007年2月9日 (UTC)

不消除地區分页无法解决将来地区标签越来越多的问题,而且简繁公版加上地区用词分页管理会有困难,我也认为中文同义词的问题根本就是很小很小的问题,我的还是认为应该完全取消地区分页,我可以算是激进派,这立场是很坚定的,难以改变,我会尊重大家的选择,但若以后有机会也会继续发表不满。--真實事求是() 14:51 2007年2月11日 (UTC)
推倒重來無助於百科的發展,任何問題都需要時間的幫忙來消弭。你認為同義詞是小問題,但我認為現在是大問題,不過也許過了10年就會變成小問題了。等到10年後,也許就不需要地區標籤,但我認為現在還是需要的。--Jnlin討論) 17:28 2007年2月11日 (UTC)

近中遠程的規劃未妥使得民心不安,現在下方的第一步已經有人反對了。--RalfX) 03:13 2007年2月10日 (UTC)

当仔细讨论,我现实生活繁忙,难以在此进行详细的讨论,既然事情已上轨道,我长久以来的讨论算是有了进展,以后将专心我的工作,较少上来这里。--真實事求是() 14:51 2007年2月11日 (UTC)

第一步:改寫Wikipedia:繁简处理

编辑

似乎在這裡的朋友都認同「簡繁處理」應與「地區慣用詞彙替換」分開處理,那就應該先改寫Wikipedia:繁简处理。因為現時的方針是將「地區詞彙替換」納入「繁簡處理」,而Wikipedia:繁简体转换请求仍不停處理「地區詞彙替換」的請求,所以應先重寫繁簡處理,暫停接受有關「地區詞自動替換」的請求,以免「一錯再錯」,直至系統問題得到解決和使用規則有共識為止。

建議在Wikipedia:繁简处理中,加入一節「新的共識」:

——舊有共識將地區詞的分歧,納入簡繁轉換系統處理,但其後發現這樣的做法產生不少問題:
  1. 地區詞與繁/簡體並無必然關係,正如「香港繁體區」的人一樣能以繁體書寫「大陸簡體區」常用的詞彙。
  2. 維基百科的簡繁轉換系統,與其他維基姊妹計劃共用,如果簡繁轉換系統包含地區詞彙替換,可能會使其他維基的轉換不準確,例如維基文庫
  3. 自動轉換過程會出現一些「失誤」,例如簡體的「數位人士」,轉換成繁體的時候會變成「數碼人士」,要透過其他技術解決,造成編輯上的困難。
基於以上各項理由,「繁簡轉換」應只是字體上的轉換,除了一些轉換後出錯的詞彙外,都不應有地區詞的替代(例如簡體的「打斗」會正確轉換成繁體的「打鬥」)。而地區詞的替代,如有必要的話,應額外建立機制解決,另訂方針規範。由於修改系統需時,而且未有定案,故現時自動的繁簡轉換仍然包括部份地區詞的替代,但將會逐步修正。

這一個改動,短期內只會影響Wikipedia:繁简体转换请求,其他較具爭議的功能(例如「馬星簡體」標籤)暫不受影響,小弟建議,如果在 2月16日前沒有反對意見,小弟將會根據上述內容改寫Wikipedia:繁简处理,將以往的「共識」列為「舊有共識」,並在Wikipedia:繁简体转换请求中列明,暫不接受「地區詞自動替換」的請求。Srr 17:46 2007年2月9日 (UTC)

  • (+)支持--Jnlin討論) 17:48 2007年2月9日 (UTC)
  • (-)反对。即使現在的系統不完美,但給閱讀者的方便遠大於困擾,也看不到迫切性,不應該貿然修改,Wikipedia:繁简处理作為系統的說明部分,也該暫時不要碰。如果要修改系統,我建議應該有人先如下面的意見所述,建立一個實驗性的MediaWiki系統,模擬新轉換環境下的中文維基,給所有維基人看看效果是否滿意後,再投票決定採用與否,不被採用就改到採用為止。橫豎維基的內容是開放的,大可以拷貝一份來測試,絕對不該一開始就去修改中文維基的軟件(及相關說明)。我看過不少系統因為未經實驗,就進行安裝新硬體、新版本、加入新功能等工程,結果發生從性能下降到系統掛掉的事故。我可不想看到中文維基發生這樣的危機。--Computor 22:56 2007年2月9日 (UTC)
你反对的和User:Srr上面提出的好像不是一回事啊,人家提出的是方针,没有改系统的步骤。到目前为止还没人提出影响维基用户的具体步骤。我在下面申请的页面都是维基百科不用的页面,源码一天两天也改不了。TTTT 23:24 2007年2月9日 (UTC)
Wikipedia:繁简处理好像不是方针喔。它不在Category:維基百科方針與指引的任何子分類裡面。我認為它是描述繁简轉換如何運作的說明文件,只有當繁简轉換系統修改了才應該作相應改動。--Computor 00:52 2007年2月10日 (UTC)
我原本想將「繁簡轉換」一併推動成為正式方針,只是基於為了更易獲得共識,毋需事事投票,才沒有這樣做。而且我必須指出,你上文的觀點極之誤導,Wikipedia:繁简处理是描述系統發展方向,而非技術的說明,技術說明請到Help:中文维基百科的繁简处理,無論怎樣,現時系統的發展方向,的確出現不少的邏輯問題,我認為這是事在必行,但並非要即時進行,技術上如何修改都未有定案,「結果發生從性能下降到系統掛掉的事故」的結論實在有點荒謬。我因應閣下的憂慮,略略再修改一下內容。我得見這裡各位大體同意這個修改,如果閣下仍要維持「反對」的話,我在此請建議閣下發起投票。Srr 06:40 2007年2月10日 (UTC)
要不然先寫個子頁面或是臨時頁面,等到系統修改後再移動過去?--Jnlin討論) 06:12 2007年2月10日 (UTC)
這就是我的意思!同意。--Computor 13:54 2007年2月10日 (UTC)
並不可行,我建議改寫有兩個目的:一、先停止地區詞自動轉換的請求,以免其他人的努力再白費。二、訂定共識,為大家日後的工作提供依據。這不應該是所謂「臨時共識」,否則以上兩點都會變得無憑無據。更重要的是,現時我不會將「繁簡處理」申請提昇為「正式方針」,你的憂慮根本不存在。Srr 14:55 2007年2月10日 (UTC)
(:)回應(一)不應該停止地區詞自動轉換的請求。新系統投入運作遙遙無期,在此其間,可能又有地區名字相異的事物出現(例如桌球一詞在香港指士碌架,在台灣指乒乓球),為了確保不同地區的讀者能正確了解這些事物,應該暫時保留繁簡轉換中的地區詞自動轉換,直到新系統正常運作。何況現在的轉換標簽還是有地區名在裡面(例如港澳、馬新),令使用者有合理期望系統會替他們轉換地區用詞。如果要關閉Wikipedia:繁简体转换请求,應該先把那些標簽改名(雖然這是另外一個爭議劇烈的提案,本人不會提出),免得讀者誤會。(二)既然不是方針,不會馬上影響維基的運作,可以試試修改,但請註明閣下加上的是關於將來的計劃,尚未實行,以免讀者和現在的情況混淆。--Computor 17:02 2007年2月10日 (UTC)
(:)回應我不认同Computor提出的几点理由,觉得他的一些概念有严重的混淆。这使我更确信繁简转换一定要和词替换区分开来,不然如同Computor这样概念混淆的用户存在更多就使词替换方针永远不能独立地讨论和完善。Srr提出的正是关于词替换的方针,不涉及任何系统问题。Srr提出的对“繁简转换”页面的修改其实根本不是繁简转换的问题,而是词替换的方针问题,只是目前,两者的讨论都并存在那个页面上。在方针层面上,如果逐渐脱离全站替换是成立的新方针,那停止表里添加地区词是非常合理的做法。如果那个“桌球”的例子有必要替换,可以用标签。这取决于这个共识到底有没有。Computor不用担心系统何时投入运作,因为并不会影响到替换方针的改动。技术的增和减都为了服务方针,不是解决方针的场所,因此提出的系统修改方案可以实现各种意见,包括词替换方针不改的意见;但技术上留有这样的余地绝不等于替换方针应该不改,恰恰相反,它减少了改的阻力。
(最后,建议你在任何页面上看到“桌球”时,不要无脑地加替换词,而依含义把它改成“乒乓球”或“台球”,然后祝贺你自己为中文维基百科解决了一些问题。如果想阐述“桌球”的多种意思,建议你参与中文维基词典的编辑。)TTTT 19:15 2007年2月10日 (UTC)
當局者迷,可能我真的混淆了。既然看到支持的人日多,我也沒有扭轉共識的可能。無論如何,這個決定是否明智,要待日後的實踐檢驗。--Computor 20:50 2007年2月10日 (UTC)
  • (+)支持:「繁簡處理」有必要和「地區詞彙替換」分開運作。--RalfX) 03:21 2007年2月10日 (UTC)
  • (+)支持:我認為分開是比較妥當的,我想大多數人之間的語言應該是可以溝通的。我想重點方向應是在於岐義的解決方法,若考量到轉換詞彙的量一大,想必對伺服器與閱讀都是種負擔。但是名稱的不同是否可以考慮盡量用Templates或重定向頁面來處理會比較妥當呢?當然如果地區詞彙真的很多,而有另外新增的需要時,我也同意如此做。Syn 12:49 2007年2月10日 (UTC)
  • (+)支持。改寫轉換程式是遲早要做的事。Z先生沒時間回來維基看看,只能靠我們自己接手。-- 百楽兎 15:45 2007年2月10日 (UTC)
  • (+)支持,幾天沒來,發覺現在的討論方向漸上軌道了,除了真實事求是兄的方案持對立狀態外(但他好像支持手工轉換?)。設立及發展繁簡公板不是一件容易的事,希望大家能堅持及協助,這可能是中文維基百科的一大里程碑,希望日後能得益中文維基其他計劃,以致整個wiki技術。目前對於技術方面可能還有疑問,但發展方向已比此前一致得多。Stewart~惡龍 19:00 2007年2月10日 (UTC)
  • (+)支持,英语中的地区词比中文多得多了,也没见要设立各种版本.还是希望中文维基越简单越好.--Ksyrie 18:22 2007年2月11日 (UTC)

英语中的地区词比中文多得多了,也没见要设立各种版本.还是希望中文维基越简单越好.--Ksyrie 18:22 2007年2月11日 (UTC)

  • (+)支持,我早就提议「繁簡處理」有必要和「地區詞彙替換」分開運作。在粤语,吴语文言之外另设立各种地区语言标签的作法和陈水扁的“正名”异曲同工,纯属庸人自扰。--民國九十六年 18:30 2007年2月12日 (UTC)
  • (+)支持「繁簡處理」和「地區詞彙替換」分開運作這一點,但是我反對貿然將新系統投入實行或是立刻廢除舊系統,應該有一段適用的期間。--あるがままでいい(talk) 11:25 2007年2月13日 (UTC)

多謝支持,已就共識修改Wikipedia:繁简处理Wikipedia:繁简体转换请求Srr 05:46 2007年2月16日 (UTC)

  • (+)支持,繁簡和地區辭分開了,接下來就是要鼓勵大家少用地域中心的詞了!我希望大家都能寫「桌球」,不要出現乒乓球和台球什麼的。--陋室(亭中茶話) 09:32 2007年2月27日 (UTC)

疑問

编辑
  • 對不起,我可否請問一下,為何經驗比較豐富,相當活躍的維基管理員或行政員(如書生兄或大山兄或WING兄),對此議題都沒有任何發言?我想知道,他們的態度是如何?我此疑問沒有任何動機,我認為較捻熟維基事務的他們態度或意見,對此有很大助益,也可讓這工作少走好幾趟冤枉路。另外,我有個不情之請,從TTTT熟悉維基事務的口吻,我擅自推斷(如有冒犯請多多包涵)他應是資深維基人,我想,如果他是某位資深維基人的馬甲,能否示出其他人或許較熟悉的其他帳號?--winertai 01:45 2007年2月11日 (UTC)

可能來晚了,但請讓我為共識一節給些意見。首先是繁簡公版,個人沒甚麼意見,反正是技術上做得到,而且有人想用。但想澄清,繁簡公版並不是「無地區特徵的資料」。因為世界上總有一些字是完全沒有任何人都看得懂的用詞的,即是說,無論用哪個詞,都總是有些人看不懂,即是總會有地區特徵,只是可能是多數地區的特徵而已。於是結論就是,「繁簡公版」只能建立出較少地區特徵的資料,要完全脫離地區特徵,是不可能的。希望共識一段可以改寫成符合這事實。

另外是地區名存亡的標準,我覺得現時技術支援的四個已經足夠,因為只有這四個地區能夠有組織性地確認用詞的標準,個人覺得不會有第五個地區吧。有些維基人說港澳用詞及新馬用詞會惹來其他地區的華裔人要求有自己的地區用詞版本,但實際上他們的用詞只會是複製自這四個地區,應該未有自行造詞的能力吧。-- Cosferia討論) 05:19 2007年2月11日 (UTC)

无所谓来晚了,讨论的大门是永远敞开的。我把“无地区特征”改了一下。TTTT 07:32 2007年2月11日 (UTC)
  • 對不起,我只是一般用戶。據我理解(有錯請指出),「地區用詞」出現的一部份問題是軟件錯誤地轉換將一些詞,例如簡體的「數位人士」,轉換成繁體的時候會變成「數碼人士」,是軟件夠不夠聰明的問題?!如是否把「繁簡轉換」和「地區用詞」分開,類似問題可以得到改善嗎?作為一用戶,改了之後,須按兩次才得以前的可以一按即轉的結果。
  • 二:繁轉簡在技術上沒有大問題,只是簡轉繁需用字庫幫助作轉換,「繁簡轉換」和「地區用詞」分開可減抵字庫增大的機會,這是否問題的重心?軟件不夠聰明才是問題的重心?!
  • 三:小小意見:市面的「繁簡轉換」軟件亦標榜包括地區用詞換轉的功能,看來是大方响,本人用過,結果不如理想,如果能改善地區用詞換轉的難題,真是中文之福,令大眾以一種言語溝通而地區小眾得到照顧。 --218.102.187.242 01:54 2007年2月16日 (UTC)
    • —、這裡是中文維基,照顧的對象是所中文使用者,而不是特定某幾個地區的小眾維基,如果閣下有興趣的話,不妨下載一套維基,自己架站,你要多「小眾」就有多「小眾」。
    • 二、軟件永遠都不會夠聰明,現時並不存在完美轉換的技術。
    • 三、閣下還是跟進一下上方和以往的討論比較好。Srr 05:59 2007年2月16日 (UTC)

见此骂战页诡辩甚多,特转文一段:
“老师,究竟什么叫诡辩呢?”
老师稍稍考虑了一下,然后说:“有两个人到我这里来做客,一个人很干净,另一个很脏。我请这两个人洗澡,你们想想,他们两人中谁会洗呢?”
“那还用说,当然是那个脏人。”学生脱口而出。
“不对,是干净人,因为他养成了洗澡的习惯;脏人却认为没什么好洗的。再想想看,是谁洗澡了呢?”
“干净人”。两个青年改口说。
“不对,是脏人,因为他需要洗澡。”然后再次问道:“如此看来,我的客人中谁洗澡了呢?”
“脏人!”学生喊着重复了第一次的回答。
“又错了,当然是两个人都洗了,干净人有洗澡习惯,而脏人需要洗澡。怎么样,到底谁洗澡了呢?”
“那看来就是两人都洗了。”青年人犹豫不决地回答。
“不对,两人谁都没洗,因为脏人没有洗澡的习惯,干净人不需要洗澡。”
“有道理,但是我们究竟该怎样理解呢?”学生不满地说,“您讲的每次都不一样,而又总是对的!”
“正是如此。你们看,这就是诡辩。”66.150.99.144 17:18 2007年2月18日 (UTC)

其實簡繁問題早就造成我的問題了,之前編寫數碼寶貝就搞了半天,在臺鐵車站列表就直接取消簡繁轉換,不知道有沒有標籤可以只取消動態轉換但仍保留靜態轉換...--蒼空 翔 有事點我 20:41 2007年2月25日 (UTC)

有時候還會需要臨時取消手動轉換,而各種轉換的取消常要長達一個表格...--蒼空 翔 有事點我 20:44 2007年2月25日 (UTC)

有沒有辦法指定一個詞是某種語系,其他的讓系統自動翻譯,不然有時會出現混亂,有的詞在不轉換/簡體/繁體會不一樣...--蒼空 翔 有事點我 17:09 2007年3月5日 (UTC)

關於手動/自動轉換功能的共識

编辑

總體發展方向已經定下,接著是規範地區詞轉換功能。但我認有數點先要得到共識,之後再訂下使用細則:

—、新系統是否保留全局自動轉換?下方的技術討論可供參考。 二、內文手動轉換標籤有三種(全页的{A|...}, 标题的{T|...}, 和单独转的{...}),不過noteA、noteT會改變的條目命名,這是否屬於「命名常規」的管理範圍?應如何處理?Srr 08:37 2007年2月23日 (UTC)

我認為還是要保留全局自動轉換,但可以逐步改為單篇文章轉換,亦即慢慢改為「有這個功能而不使用」。noteA不會改變條目命名,只有noteT會。目前的命名常規規定先到先得,其他重定向,或許可以加入「最通用命名」方針,但要注意「如何評估最通用」,不能以「人口多」之類的方針。--Jnlin討論) 08:41 2007年2月23日 (UTC)
赞同不是人口多的方针,而是以歧义少的方针。TTTT 22:47 2007年2月23日 (UTC)
地區詞的轉換部份,建議完全取消,這樣才能避免條目說明中的引文、文獻中的地區詞連帶被轉換的現象。至於較難理解的地區詞,如兩岸醫學用語等,則依Wikipedia:避免地域中心原則,於首次出現加上其他地方之等義用語。(條目名稱可進一步討論)譯名則效法英文版Wikipedia,於初次出現時加上原文名稱,以便於資料查找及他地人理解。RekishiEJ 08:30 2007年4月19日 (UTC)

标签名称参考

  • 转换标签名称:
MediaWiki:Variantname-zh-cn
大陆简体 最后编辑:Fdcn,摘要未说明任何原因
MediaWiki:Variantname-zh-tw
台灣正體 Kevinhksouth据台湾维基人意见所选,香港投票原无此项
台灣正體 最后编辑:Ran,恢复了Shizhao去除的台湾字样
MediaWiki:Variantname-zh-hk
港澳繁體 最后编辑:Kevinhksouth,香港標籤投票主持人
MediaWiki:Variantname-zh-sg
马新简体 最后编辑:Sl,据馬新標籤论争投票
懂中文字的話,應該明白「未有定案」是甚麼意思吧?Srr 19:48 2007年2月18日 (UTC)
上面并未指明定案,只是随时监督条目操作,与有无定案无关。--- 量子公民talk 21:08 2007年2月18日 (UTC)
是因为“已确定”那个词吗?已删除。--- 量子公民talk 21:28 2007年2月18日 (UTC)

为了如此简单的问题竟然作了这么复杂持久的讨论,简直是不可思议。 以下就是解决方案:

  1. 完全关闭词汇转换功能。
  2. 任何情况下,一个字如果对应多个相对体字,这个字不转换。
  3. 外文专有名词直接写作外文或英文,或在译名后写出外文或英文。
  4. 在有分歧的名称后面说明别名,或采用更易于理解的名称。
  5. 改进转换功能,使能够对繁简体字混合的文章进行统一转换。

Efeb 2007年4月21日 (六) 07:52 (UTC)[回复]

技術討論

编辑

参考资料

编辑

TTTT 09:15 2007年2月8日 (UTC)

在Subversion上的

請提議者先看看在Subversion上的源碼,有關的轉換方式是在MediaWiki軟件裏本身做的,對標籤的修改可以找管理員協助;但對轉換方式,則須由用戶修改源碼,再由『遞交者』(Committer)應用已經修改好的源碼,放上Subversion中,才能應用變更。在CVS時代中,懂漢語的『遞交者』只有User:Zhengzhu一人。而到了Subversion時代,並沒有任何一位懂漢語的『遞交者』,包括Zhengzhu,這需要將請求放上Bugzilla中,在Bugzilla中的其它開發人員或『遞交者』亦未能熟悉漢語,可能會遲遲未能套用修改。--Shinjiman 01:52 2007年2月4日 (UTC)

    • 我不太懂程式語言,但我想問:程序上,「馬星/大陸」、「港澳/台灣」是否歸為繁簡兩類?再要仔細轉換就要依靠「內文替換標籤」?如果是的話,好像不一定要涉及MediaWiki軟件源碼修改,最起碼Zhconversion.php不用改。Srr 07:27 2007年2月4日 (UTC)
依我的看法中,現時的Zhconversion.php檔案裡,zh-cn的轉換文字包括了【簡化字】以及【中國大陸字詞】的轉換;zh-tw的轉換文字包括了【傳統字】以及【台灣字詞】的轉換;zh-hk的轉換文字包括了【香港字詞】的轉換;zh-sg的轉換文字包括了【新加坡字詞】的轉換。另外在LanguageZh.php的內容中,zh-hk是直接繼承了zh-tw轉換表再上zh-hk轉換表的內容;而zh-sg是直接繼承了zh-cn轉換表再上zh-sg轉換表的內容。因為zh-cn以及zh-tw的部份包括了傳統字與簡化字的轉換,故此要解決這個問題,則需要修改zhtable生成出來的Zhconversion.php以及在LanguageZh.php中的轉換從屬關係。--Shinjiman 11:52 2007年2月4日 (UTC)
请大家在讨论对繁简转换作进一步的技术改进的时候,请不要只顾及wikipedia社群,也要同时照顾到其他的wikimedia姊妹计划。例如wikisource因为是原始文献的收集,所以根本不需要地区用词的转换功能,而只要求用字的转换,这样才能保证文献的原貌。另外,wiktionary和wikiquote可能也存在类似的情况。 --百無一用是書生 () 03:22 2007年2月7日 (UTC)

详细阐述目前的转换技术

编辑

我看了一下mediawiki的源码。user:shizhao说的这点我昨天也意识到了,确实mediawiki里放替词表不合适,特别是经常需要更改的数据本就不该放在源码里!具体说一下,

  • includes/zhtable/* 里没什么数据,(源码里的转换大多靠引进Unihan等公共数据库,所以基本上是静态的)。
  • includes/zhtable/MAKEFILE 生成includes/ZhConversion.php,里面就定义四个转换表变量,其中$zh2CN列前半是繁转简字词,后半是台湾(繁)=>大陆(简)翻译词,$zh2TW列前半是简转繁字词,后半是大陆(简)=>台湾(繁)翻译词。$zh2SG则是大陆、台湾、香港=>新加坡译词的合并,$zh2HK是大陆、台湾、新加坡=>香港译词的合并。
  • languages/LanguageConverter.php 定义转换基类。
  • languages/classes/LanguageZh.php 延伸转换LanguageConverter类,其中引进 includes/ZhConversion.php的四个转换表变量,zh_cn版、zh_tw版分别用$zh2CN和$zh2TW转换,zh_sg版用$zh2CN和$zh2SG的合并,zh_hk版用$zh2TW和$zh2HK的合并。

由此可见,这里面混乱得不得了,特别是zh_sg和zh_hk的做法过于劣等(比如已经陆译台了为什么还有陆译新的替换对等等),怪不得之前两种variant招牌挂着却不投入使用。

  • 全站转换的数据来自上述源文件里的静态表和 MediaWiki:Conversiontable/* 里的动态表的结合。这是所谓的“自动转换”。
  • 除此,还有搜索、标题连接、外语连接、版块等等的转换都用了这个表。
  • 源文件里也有标签转换的迹象。支持三种标签(全页的{A|...}, 标题的{T|...}, 和单独转的{...})。这是所谓的“手动转换”。

我看这些重叠表的使用都可以废除了。下面写一点并非完全成熟的技术策略TTTT 02:11 2007年2月9日 (UTC)

  • 仍須保留地區用詞整體轉換表;若未完善則須試完善之:共識中有:應建地區用詞進退機制。--Hillgentleman | | 2007年02月09日( 五 ), 03:02:56.

我認為zh-hk不應直接繼承zh-tw轉換表,而應獨自建立新表,原因是香港跟台灣的用字很多都不相同。

  • 例:香港用「衞」、「裏」、「卧」、「兑」、「昷」、「着/著」分開使用,台灣則用「衛」「裡」「臥」、「兌」、「囚+皿」、「著」代替「着」。拔萃仔 06:39 2007年2月11日 (UTC)

技术策略

编辑
  • 编制全新的简转繁和繁转简转换表(静态的两个表,动态的两个表)。
    • 制表的最高指导方针是:“服务现代汉语”和“转字不译词”,因此,
    • 一对一的字无疑义,直接置入静态表。
      • 各地区为同一概念造的不同的新字如果表音相同可以视作异体。
    • 一简对多繁的字多为假借字。汉语假借仅两种可能:
      • 借形,比如假借古罕用字(形)的“宁”、“广”,则现代汉语里实属一对一,直接置入静态表。
      • 借音,比如“斗”、“谷”、“干”、“表”、“面”,都一律放在动态表里。
    • 一简对多繁也可能是异体字
      • 把只有一种正规体的异体字作为一对一放入简转繁静态表里;凡是繁转简一对一的纯异体,则放入繁转简的静态表里,其他的放在动态表里。
    • 一繁对多简的字(比如“乾”,“堃”)同理留给动态表。
      • 这里面包括允许用于人名的异体字。
    • 简繁和繁简两张动态表里置放所有的一对多转换,可以采取一定的自动化手段协助完成制表,如下:
      • (注:以下所指的“左边”和“右边”指表的“两边”,即“左边”的字串转换成“右边”的字串。)
      • 列出所有的一对多的字对,以最常用单字顺序排列:如:“斗=>鬥,斗”,“乾=>干,乾”,“堃=>堃,坤”。箭头右面可以用array,如果技术上不能实现则最终只保留第一个转换字。
        • “最常用”并不等同于不转换的字,比如“斗=>鬥”,“干=>乾”是最常用。但“堃=>堃”最常用因为“堃”作为人名远比作为“坤”的异体常见,大多可以用作人名的繁转简异体字都如此。
      • 为了区分义,表里左边的每个字都列出包含该字的最短包含词,并列出转换
        • 如果词和对应词都一头或两头裁字(最短裁到两个字),结果仍是汉语词并已经在表里存在一对一对应,则该词不是“最短包含词”。
        • 如果一词对多词,以最常用顺序排列。如果技术上只能取一个,则最终只保留右边的第一个词。
        • 注意不译原则,即使一个词在某地区有另一种意思或从来不用,也不译。
      • 校对1:列出表里所有出现非吞没式重叠的左边词对(简转繁的话则如:“头发”、“发表”、“表面”、“面条”),并拼凑。
        • 如果拼凑出来的也是词并且会形成表里未出现过的最短词对,就必然是漏掉的词对,也加入转换词对。重复至没有新词加入。
      • 校对2: 列出右边非第一项的字串中仅在该对里出现的字串。这些是仍存在歧义的字词对
        • 检查是否漏掉了可以消除歧义的更长词对。如有,加入,重复。
      • 到了这步,仍存歧义的字词对都是难以自动转换的,没人工智能不可能分辨。
        • 比如异体单字(如人名里的异体)和语法差别词(一些繁体里动词/名词写法有别的词)
  • 以上是理想的制表方式。但为了方便,应该先利用现成的表数据作为起点,这并不是很难,手动都可以完成,但输出的表可能有重叠或其他问题,可以慢慢清理。
  • 有了这些表,简繁转换就可以以最长吻合字串的做法来完成。步骤如下:先在文本里搜索转换表右边的词,所有搜索到的词都已经是目标字体的了;继续在文本里搜索转换表左边的词,有吻合就转换成右边的词。如果右边有多项字串,则取第一项字串(就是最常用的字串)。
  • 碰到转换不好的文章,首先动用不显示的分隔字串(目前有{})做词分隔,而不是把周围的几个字一起加到动态转换表里去(除非形成的确实是表里漏掉的,而不是一个特殊的片断)。
  • 至于地区词的互译,建议用标签实现。如果必要整站转换(看不出这个必要,但如果一个标签出现很多或为了连接和搜索等),则应另设表(而且索性来个全对应表,而不是四个地区排列组合出6个对应),然后先上替换表,再上繁简转换表。现阶段可以沿用抽掉繁简转换部分的替换表,但应该审视并逐渐剔除不符合原则的替换(原则待讨论,见“共识”段落)。
  • 增设zh-hans和zh-hant两种variant,分别为标准版简体和标准版繁体。保留zh。
  • 其余variant的处理方式也根据需要修改源码。

同时请参考中文维基最初建立繁简体兼容体系时的Wikipedia:繁简处理/技术方案

最后随便说一句长远一点的话,其实啊,如果中文维基字典做得好,就是最好的转换表源了。 TTTT 13:09 2007年2月7日 (UTC)

静态表做繁->简汉字的一对一无歧义转换,动态表做一简->多繁的汉字转换,需要日常维护。词语的转换最好在各个条目用noteA标签解决,不要设全局转换表。--Alexcn 05:21 2007年2月9日 (UTC)
非常恰当的总结。TTTT 05:29 2007年2月9日 (UTC)

下一步

编辑

完成以上的计划需要修改源码,比较麻烦。但是大部分仍然可以不修改源码完成,性能会差一点,作为尝试则不成问题。因此:我准备先兴建两个动态转换表,分别为zh-s和zh-t服务。其中一部分将来可以移至静态表。最终这两个名字按照国际标准应该叫作zh-hans和zh-hant,zh-tw应该改为zh-hant-tw,以此类推。zh-hant转换的动态表页面似乎已经存在,不知道是什么缘故。 我已经向管理员申请了,请给予支持。TTTT 05:27 2007年2月9日 (UTC)

我覺得閣下應該是要下載一套MediaWiki軟件,再進行修改;修改後將它放給開發員處理。只是在維基百科中授權,亦不會對MW軟件的修改有任何的幫助。--Shinjiman 11:53 2007年2月9日 (UTC)
确实应该先架站试验一下,等社区达成共识,充分测试之后再上线修改。--Alexcn 13:15 2007年2月9日 (UTC)
我申请的两个页面是为了让所有人都过目一下上面所谓的繁简转换包括哪些词、不包括哪些词,毕竟有一些边缘案例,也可以借维基用户的力量完善一下这些一旦改系统就要用的表。我自己建个站根本不解决这些问题。我不认为这有什么不恰当,或与另架测试站有什么关联,两者大可以并行进展。我要求的页面根本不被使用,既不影响目前维基百科的运作,又可以为下一步的修改做准备。请各位管理员重新考虑我的提议。TTTT 23:34 2007年2月9日 (UTC)
個人不建議在中文維基百科上做技術嘗試,畢竟這樣風險太大(一方面網站瀏覽量很大,一方面資料庫也很龐大)。如果您需要中文維基百科上的條目在自己架設的網站做驗證,可以,這裡提供中文維基百科的XML資料表(雖然非常大,上GB,別被壓縮過的大小騙了),可以架設在測試網站上做驗證。--笨笨的小B | 20巷 12:13 2007年2月10日 (UTC)
至於書寫轉換表的部份,您大可以在您的User頁面下做個子頁面(像User:笨笨的小B/Current new),然後在這個頁面告訴大家有這個東西。因為在MediaWiki名字空間上的項目可以影響系統介面,比較容易發生衝突的問題,因此不建議在MediaWiki名字空間書寫。--笨笨的小B | 20巷 12:15 2007年2月10日 (UTC)
同意以上諸位的說法。另外,全局轉換表不宜一下子全部拿掉,必須慢慢來。--Jnlin討論) 14:45 2007年2月9日 (UTC)
我不是很支持zh-tw改成zh-hant-tw,因為zh-(tw, cn, hk, sg)是RFC 1766規定的標準,參見W3C HTML 4.01規格書。另外找到了一個可供參考的連結,Wikipedia talk:繁简处理/档案6。--笨笨的小B | 20巷 11:57 2007年2月10日 (UTC)
其RFC 1766以及它的後繼者RFC 3066已經不再使用了。現在有關的RFC正式標準應為RFC 4646。--Shinjiman 03:21 2007年2月11日 (UTC)
看了RFC 4646,zh-(TW, CN, HK, SG)還是標準用法,字體tag是optional。字體tag的好處應該是容許zh-HANS-TW, zh-HANT-CN這類用法。其實也和之前討論的方向很像,也就是字體(書寫系統)與地區分開處理。或許漢語拼音也可以歸類於zh-LATN呢(漢語,使用拉丁字母)。--Fauzty 12:52 2007年2月17日 (UTC)
(與主題討論無關)若用那種標示,漢語拼音應為zh-LATN-CN,另有zh-LATN-TW通用拼音(雖然台北市是用漢語...)--蒼空 翔 有事點我 21:59 2007年2月25日 (UTC)

好像有一段時間沒討論了?!

编辑

請問上述的討論是否已有定案?是否有結論?Stewart~惡龍 11:48 2007年3月7日 (UTC)

不是大家都在忙,就是像我一樣沒話可插...惡龍來插個話,我給你一條大魚XD...--陋室(亭中茶話) 11:51 2007年3月7日 (UTC)
我看了一下发现应该是取得共识了,但是似乎对于具体该怎么着手去做似乎还没有人去做,我们是不是要成立一个简繁地区改革小组,并有维基社区授权他去处理这个事情呢?要不然由于设计的人和事务太多,可能实行起来有很大阻力.--Ksyrie 12:03 2007年3月7日 (UTC)
赞成你的意见,维基人是自愿的,这样繁复的工作要一二个人去完成不合情理,而且在改革的过程中可能有新的想法或问题产生,有讨论的必要,确实需要成立小组。由于我现实工作繁忙,加上对这些技术不太了解,不会参加这小组。--真實事求是() 11:17 2007年3月8日 (UTC)
對於這種的改動是要修改MediaWiki軟件本身的,此外,要作修改前,必須先要收集好要作轉換的詞彙。然後才能執行。基於這種的修改是與管理員權限是無關的,故此有管理員權限的用戶亦都無能為力。這需要一些懂修改php的人士幫忙,以解決這種的問題。這問題不只是維基百科本身的問題,是所有使用MediaWiki軟件的網站都有這個問題,所以這次的修改亦需要小心地去進行。--Shinjiman 12:21 2007年3月7日 (UTC)
不知道有沒有行政員帶頭,不然是沒人能動程序的...另外我的兩個問題有沒有解...--蒼空 翔 有事點我 15:30 2007年3月7日 (UTC)
由懂得处理这些事,以及有兴趣的维基人推动此事,不一定非行政员不可,不要忘记主导维基是大家的共识,行政员管理员只是义工而已。我提议由Ksyrie和Shinjiman推动成立小组吧,Shinjiman研究这事很久了。--真實事求是() 11:17 2007年3月8日 (UTC)
不過,要有行政員才能完成修改吧...--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)
不是要行政員呀,真正需要的是懂php的人士,以及能夠在MediaWiki SVN有寫入權限的『遞交者』。--Shinjiman 16:48 2007年3月8日 (UTC)
整理我的問題:1是能否取消語詞轉換,但保留單字轉換;2是能否將一個詞語指定語系,讓系統不會亂翻--蒼空 翔 有事點我 15:33 2007年3月7日 (UTC)

剛才發現一個問題,在廣東話裡“架次”可以作車輛的量詞,但在台灣只用於航空器...--蒼空 翔 有事點我 19:49 2007年3月7日 (UTC)

已经有粤语维基,广东话的用词不适合在这里用。--真實事求是() 11:17 2007年3月8日 (UTC)
啟德隧道有看到此一用法--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)
對於這種的做法,應該無需要在預設轉換表中轉換。--Shinjiman 16:48 2007年3月8日 (UTC)

其实大家已经取得共识,问题在技术方面而已,似乎TTTT在研究中,请问进展如何?--真實事求是() 11:17 2007年3月8日 (UTC)

我只會寫basic程式,不會寫php,不過可能可以提供一點小意見--蒼空 翔 有事點我 15:32 2007年3月8日 (UTC)

嗯,最大的困難我想一定是技術方面。我對MediaWiki這麼大型的程式,可能需要幾個月的時間全職研究才能搞懂,而很不好意思的是,我沒有那麼多空閒時間。所以希望有志願者能幫忙研究修改程式。--Jnlin討論) 08:08 2007年3月16日 (UTC)

忽然發現,在各個section的標題作詞語轉換時,自動產生的目錄卻不會跟著改變,這點也可能需要修正。--Jnlin討論) 08:27 2007年3月16日 (UTC)

问题多,技术复杂,一、两个人弄不来,Ksyrie成立小组的提议非常适宜。由部分人开始推动吧,我提议先设小组专门页面,任何人有兴趣都可以加入小组,提供意见或分担大家的工作,更重要的是必须有懂行的人来“领导”大家,否则还要花时间去学习熟悉各方方面面,也会走很多冤枉路,Shinjiman研究简繁的事情很久了,是很好的人选,不知有兴趣否?--真實事求是() 15:30 2007年3月16日 (UTC)

Names.php更新

编辑

現在顯示語言標籤的名稱已經更新了(rev:21200, rev:21201),zh-cn會將會由【中文(简体)】改成【中文(中国)】,現時顯示成〖中文(中国大陆)〗;zh-hk會將會由【中文(繁體)】改成【中文(香港)】,現時顯示成〖中文(香港)〗;zh-sg會將會由【中文(简体)】改成【中文(新加坡)】,現時顯示成〖中文(新加坡)〗;zh-tw會將會由【中文(繁體)】改成【中文(台灣)】,現時顯示成〖中文(臺灣)〗。此外,zh-hans以及zh-hant亦將會增加,zh-hans會顯示成〖中文(简体)〗,zh-hant會顯示成〖中文(繁體)〗;這對將會做的中文用字轉換系統的重組有所幫助。--Shinjiman 15:41 2007年4月12日 (UTC)

为什么“【中文(简体)】改成【中文(中国)】”?这和目前的“大陆,香港,台湾。。。”矛盾。—Isnow 18:27 2007年4月12日 (UTC)
zh-cn ← Chinese (China)、zh-Hans ← Chinese (Simplified),將兩者區分出來,避免混淆;而這裡的改動並不是更改頁頂的標籤,而是更改在跨語言連結、以及在參數設置中的顯示名稱。請參閱RFC 4646所引用的IANA language subtag registry。--Shinjiman 18:46 2007年4月12日 (UTC)
  • IANA language subtag registry中提到的“zh-Hans-CN”为“PRC Mainland Chinese in simplified script”对应的也是“中国大陆”
  • 为避免分歧,需要“頁頂的標籤”,“跨語言連結”、“參數設置中的顯示名稱”都使用“中国大陆”(或简称“大陆”)而不是“中国”
Isnow 20:58 2007年4月12日 (UTC)
那使用【中文(中国大陆)】可以嗎?--Shinjiman 21:28 2007年4月12日 (UTC)
已經重開Bugzilla:8599,並已經在rev:21205修正了。--Shinjiman 21:43 2007年4月12日 (UTC)
谢谢!—Isnow 22:26 2007年4月12日 (UTC)

繁簡字詞跟地區用詞即將正式分拆

编辑

很久都沒有討論過這個問題了,我已經在rev:28045中正式修改了源碼,讓繁簡字詞跟地區用詞正式分拆。到更新後的MediaWiki:Conversiontable/zh-hant以及MediaWiki:Conversiontable/zh-hans都會正式成為MW轉換系統的正式一部份。而無需要以現時在zh-hk/zh-tw中包含著zh-hant轉換表來處理這個問題。同時在語體中文系維基網站會由5種字體變換增加到7種,所增加的是『簡體(zh-hans)』跟『繁體(zh-hant)』。到更新後,需要在MediaWiki:Monobook.js中修改相應的項目。

在更新源碼的同時,有關的轉換字詞可能會出現轉換問題,到時請在此匯報一下,再查看有什麼的解決方法。

到現時為止的『中文(澳門)/zh-mo』以及『中文(馬來西亞)/zh-my』會否增加到MW的轉換系統中,歡迎大家繼續討論這個問題。 --Shinjiman 2007年12月2日 (日) 09:32 (UTC)[回复]

終於有進展了,辛苦了。—Fauzty 2007年12月3日 (一) 07:33 (UTC)[回复]

太好了,终于有简繁公版了,辛苦了。现在简繁系统已很混乱,似乎不适合再增加地区用词分页,应先解决现有问题。另外,建议建立专页,介绍简繁系统的各种技术,以免再度失传,相信这是一个庞大,耗时费日的工程,或可以成立小组的方式进行。

现在这系统,能够容纳多个地区用词页面而不混乱吗?--真實事求是() 2007年12月3日 (一) 14:00 (UTC)[回复]

以前的轉換方法是這樣的:
變化 轉換字詞組
zh (無變換中文) -
zh-CN (中國大陸) CN
zh-HK (香港) TW + HK
zh-SG (新加坡) CN + SG
zh-TW (台灣) TW
現在的轉換方法基本上是這樣的:
變化 轉換字詞組
zh (無變換中文) -
zh-Hans (簡體) Hans
zh-Hant (繁體) Hant
zh-CN (中國大陸) Hans + CN
zh-HK (香港) Hant + HK
zh-SG (新加坡) Hans + SG
zh-TW (台灣) Hant + TW

這樣的更改可以先將繁簡/地區用字分拆清楚,避免了香港轉換表使用台灣轉換表的問題(很多的台港字詞有歧義);跟新加坡轉換表使用中國大陸轉換表的問題(很多的中新字詞有歧義)。--Shinjiman 2007年12月3日 (一) 14:28 (UTC)[回复]

閣下所指的是頁頂標籤?因為這設定是應用於全網的,如果可以的話,那就需要在信息檔中再修改一下。--Shinjiman 2007年12月4日 (二) 23:38 (UTC)[回复]
己經啪上到rev:28174了。 --Shinjiman 2007年12月5日 (三) 02:45 (UTC)[回复]

這次的分拆尚無法達成像zh-Hans-TW, zh-Hant-CN之類的功能,可惜了點。雖然目前的分拆已經滿足社群大部分的需要,像這種特殊的需求大概不多,但是有此種功能的話,對於想學習繁體/簡體字的朋友們是很好的。—Fauzty (留言) 2007年12月5日 (三) 14:11 (UTC)[回复]

雖然這樣作可以再細分一些,但如果要這樣分,那變換就需要十多種了。如果不保留原先的zh-CN/zh-TW/zh-HK/zh-SG等變換,那跟以前的用法就不能相容了。--Shinjiman 2007年12月5日 (三) 14:25 (UTC)[回复]
zh-CN/zh-TW/zh-HK/zh-SG還是有保留的必要性。我這個意見,只是未來如果要擴充功能時可以參考看看。—Fauzty (留言) 2007年12月5日 (三) 14:47 (UTC)[回复]