维基百科:互助客栈/消息/存档/2014年6月

汉语种百科流量历史数据

汉语种百科流量历史数据的视觉化/可视化--❦维基vs百度来源专题 hanteng 2014年5月23日 (五) 10:26 (UTC)

此为资料可视化的互动及动态产生(svg档格式和json等web friendly的前端资料产出的流程建立)的试做,再补上一个本人试作的互动cartograms为例,利用了最近中国统计当局开放的资料。现行一张又一张的地图或图表,不但难以更新也较互动式图表的局限多,可否考量未来维基平台的相关图表的再一次基础建设更新。--❦维基vs百度来源专题 hanteng 2014年6月1日 (日) 03:48 (UTC)

转发:被“革了命”的维基百科和进化中的知识协作

传送门:http://tech.sina.com.cn/zl/post/detail/i/2014-05-15/pid_8452959.htm-- 2014年5月17日 (六) 06:03 (UTC)

原文有一些观点有意思,但我认为它指出的道路—“后维基时代的知识图景”一节—里面有些点是不成立的,更让人隐隐感觉本文是在给某些商业机会做铺垫。 因为我也有一些系统的思考,这里给出我对此文的回应,也希望大家可以探讨:

文章开头指出—“存量知识已经渐渐颗粒归仓,增量知识又因为支离破碎而无法捡拾”,这个观点是有趣的。很多人都在做类似的思考,也包括我在内。 先简单说一下“后维基时代的知识图景”一节不成立的地方,后面再对增量过程来展开。

  • 人的因素确实重要;但考虑到知识生产(也就是增量部分)的艰难,所谓“社交网络及移动互联时代”的这些商业噱头并不成立。
  • 碎片化而非结构化:我个人也觉得碎片重要,但上文作者此处的碎片化应该是因循社交网路的碎片化而来的,那里的大部分碎片之间并没有太多逻辑的关联;碎片之所以重要,是因为人类知识增量过程是通过碎片一小步一小步艰难完成的,每一步都付出很多。
  • 媒介格式:格式对于思考的突破没有那么重要,音频、视频的出现,多半是在增量完成之后的解释阶段;信息可视化有助于增量的达成;格式问题目前看来 iPython Notebook 和WolframAlpha 的 CDF 都在努力解决,但整体突破或许可能要等待 HTML 的下一个重要版本了。这里的批评有待整个工业界的努力,对维基的批评并不简单成立。
  • 不再追求标准答案:维基从来没有追求过标准答案,这一条对维基的指责并不成立。

我个人对增量过程也很感兴趣,早在2002年汪丁丁先生早就撰文指出了“语言创造”的困难。

 汪丁丁观点修订版:宽带写作是宽带技术提供的创作方式,强调大规模的信息集结和带来的创作。
 大规模的集结或整合,绝非单纯的数量积累,而要求深度思考。
 思考越深入,集结规模就越可宽广。宽带写作的理想形态是在集结了整个网络上与主题相关的信息之后,
 在由此而达的思考的深度和广度上,实行语言创造。

我对此曾经有如下的阐述:

 微博上人们相互呼应,新鲜想法诞生、传播、生长、发散、汇聚。
 围绕有生命力的想法,实践者联系起来产生实践活动,渐渐成长出人际圈和知识域。
 当后来者进入这圈子和领域时,需要一个引领的途径,实践者从想法中理出脚手架供人攀爬,
 有些脚手架存在几个世代甚至几千年了。它们是活的,是引领我们的路途。
 知识的集结、实践者团体的连接变得越来越容易,这是一个正在发生的过程;
 但语言的创造依然艰难,学习的过程不能被取代;
 碎片化的方式并不一定适合所有的领域,学习还是需要付出努力才能掌握前人留下的“脚手架”。

对于增量过程如何完成的,我个人的思考结果是一种知识的波动观和颗粒化机制:

回归到工具层面,我个人的观点是“智能增强”:

 机器不需要僭越人的位置去创造,而只是借助人类智能的创造力,通过相对固定的算法,
 把新词汇和新旧词汇间的关系综合起来,来帮助人们更好的做事情。这就是我们前面讲到的智能增强。

在工具的实现上,我觉得开源的或者商业的笔记类的知识工具是更可能的实现方式。

以上是我的一些简单看法。--Mountain留言2014年5月22日 (四) 14:53 (UTC)

真希望Mountain能回归管理层,给中文维基多带来一些思想。如今规章制度的大网越织越密,管理员忙于/惯于/乐于维护这张网,整个社群基本上还是按照多年前的惯性前进,事务主义让人窒息。--Gilgalad 2014年5月22日 (四) 17:30 (UTC)
谢谢。不过确实生活、工作非常繁忙。这些想法还很粗浅,落实下来,还要去找构造算法、语料库上实测、寻求例证等等,才能真正成为站住脚的一种观点;工作还很多,不过我有兴趣缓慢推进。--Mountain留言2014年5月23日 (五) 04:49 (UTC)
这些各种开放资料的重新组合再造,其实不仅限于传统定义的自然科学,还有社会科学(如computational social science)、资讯/信息计量学、及人文科学等等(如human geography of web data),维基百科的角色个人建议是成为人读的懂有脉络有来源的data curation 资讯/信息展示平台。 最近中国统计当局开放的资料及可视化界面,和中国几大网路平台的合作,将有更多资料展示的空间,若不嫌弃,可看本人试作的互动cartograms为例,重点或许在于资料可视化的互动及动能产生(svg档格式和json等web friendly的前端资料产出的流程建立),而不是现行一张又一张的地图或图表,不但难以更新也较互动式图表的局限多。--❦维基vs百度来源专题 hanteng 2014年6月1日 (日) 03:44 (UTC)
多谢回应!我个人对开放数据数据可视化也有兴趣。不过依照数据信息知识的传统层级划分,开放数据和数据可视化都在比较低的层级上。维基百科更是知识的 curation 平台,其中包含一部分数据和信息的 curation 任务,但后者更多将会在维基数据计划中来承载。但现在的维基百科的缺点是,它虽然整理了知识,却无法把相关的读者、编者非常有效的整合起来;而且它只处理知识生产后期形态相对完备的知识点,对于尚未完全成型的知识点,它能够辅助的比较有限。当然,我想像的这种辅助知识创新的工具,应该已经超出了维基百科的使命和范围了。--Mountain留言2014年6月5日 (四) 15:38 (UTC)

这两天的一些新的关于“可观察性”的想法。“可观察性”的想法最早来自于沃德·坎宁安,他在发明 Wiki 时意识到整个系统必须可以有效的被观察到,才能很好的工作,所以他发明了 RecentChanges 的时间线。今天的维基百科已远非当年的小小站点,如今维基百科的 RecentChanges 已经不能达到有效的被观察的目的了。我们能否重新思考“可观察性”来激活读者和编者呢?举例来说:

  • 我曾经尝试过的 UltraFilter 把 RecentChanges 巨流按照学科拆散,能多少提高一点观察的有效性
  • 参考文献和站外链接里有非常丰富的信息,能否把全站的参考文献和站外链接的更新汇总,重新组织后发布出来呢?
  • 头几年的 Wikizine 和后来的 Signpost 定期汇总社群重要消息,其实也是“有效的可观察”的思路

只有有效的可观察,才能更容易激发人们的参与意识。而维基必须克服传统的知识压倒人的做法,在观察和参与的过程中促成更加和谐、顺畅的人的链接。我觉得从上述角度看,维基百科可以改进的还很多--Mountain留言2014年6月5日 (四) 16:04 (UTC)

Wikidata weekly summary #112

有报道称维基百科 90% 的医学资料有错

这是我发现的传送门

-- 2014年6月1日 (日) 11:25 (UTC)

有错是真的,这个标题“90%的医学资料有错”是误导性表述吧。原文说90%的条目包含错误信息,没说这90%的条目中每条条目中的资料100%是错的。Liangent留言 2014年6月1日 (日) 11:41 (UTC)
所以上回那个美国大学组织医学学生编辑维基百科是极好的一个办法,再者不知道为什么英文版从来不见有{{medical}}。--浅蓝雪 2014年6月1日 (日) 16:39 (UTC)
因为页底已经有免责声明,没有必要所有条目中再加上一个--百無一用是書生 () 2014年6月3日 (二) 02:04 (UTC)
是那个Disclaimer?可是中文不是也有嘛--浅蓝雪 2014年6月3日 (二) 05:23 (UTC)
英文维基的WP:NDT是正式指引,中文不是。可参考2007年7月25日26日的讨论。--M940504留言2014年6月8日 (日) 01:51 (UTC)

关于学术期刊类的

哪里可以提供期刊类的学术网站 --Good2018留言2014年6月4日 (三) 08:39 (UTC)

Google 学术搜索能搜这类网站的信息。-- 2014年6月4日 (三) 15:01 (UTC)
@Good2018:看这Wikipedia:互助客栈/其他#共享文献数据库。--Gilgalad 2014年6月10日 (二) 11:01 (UTC)

越南语版条目数超过日语版

如题。越南语版913505个条目,日语版911510个。--GZWDer留言2014年5月30日 (五) 05:10 (UTC)

天哪,越南语WP又开始刷条目了啊!看来,如果越南语WP再刷九万的话,它就成为第一个条目数突破一百万的亚洲语言版本了(前提是瓦瑞瓦瑞语和宿雾语这个时候没有开机器人去刷条目)!--To be №.N 2014年5月30日 (五) 06:05 (UTC)
我们这里都没人急,急什么,而且还四处唱衰的,急什么也没用。刷得不好又骂,写得慢又骂,看着人家开机器人刷就算刷得不好也只会干咬手帕,哎╮(╯▽╰)╭ ,累了不爱啊——路过围观的Sakamotosan 2014年5月30日 (五) 07:24 (UTC)
  • 个人还是认为质量优先数量,再说地域不同条目内容会有许多差异,比如社会事件、历史、尤其是行政区和戏剧。最近常看到有人创一些古代秀才的简短资料,倒底是干嘛的?关注度就有极大问题了吧,还有一堆杂七杂八的古装剧乡土剧,所以用条目数去衡量一个语言非常不准,重点还是在基础条目质量(强烈支持自然科学!)。另外中维扣除消歧义只有749033,真正条目数不能看首页的统计。最后,英维就拿元素说好了很多不是特色就是优良,中文维基人似乎没有非常热衷去完善一个条目,又加上有方言分散势力(维基大典更是),还有好长的路要走(以上是在下这两个月的见闻,有错还请纠正)__^ 2014年5月30日 (五) 10:00 (UTC)
    好像不是秀才吧,秀才和进士的区别可大了呢。。。--AddisWang (留言) 2014年5月30日 (五) 15:54 (UTC)

呵呵。—Snorri留言2014年5月30日 (五) 16:05 (UTC)

光靠条目数而缺乏质量的名衔,百度百科应该稳握手中,我们不须要去争。User:水思,元素条目是我的工作重点,不是没人乐意完善一个条目,只是孤身一人比不过千万大军呀!钢琴小子 打个招呼 查看贡献 2014年6月1日 (日) 04:04 (UTC)
我有看过你的周期表,元素算我一份,我确定要翻了,现在在等动员令。是说我还蛮期待中日大战的,只是要记得数字不是真的(真扫兴)__^ 2014年6月1日 (日) 07:30 (UTC)
也算我一个,我要翻我家:) --砜中嘌呤的白磷萃取 打谱 2014年6月8日 (日) 01:59 (UTC)
  • 这家伙[1]用户页真是太嚣张了,到底越南是怎么冲条目数的?或者应该说我们之间差的条目数是在哪部份?影视娱乐?还是自然科学?(日语有没有打算要追啊,我倒宁愿是日语先)__^ 2014年6月11日 (三) 04:03 (UTC)
Hello there! I am not arrogant as you think. I guess you use Google Translate to understand the meaning on my page. Sorry typing in English because rarely of us know or learn Chinese. Alphama留言2014年6月11日 (三) 23:08 (UTC)

越南版上百万也指日可待了呢。—Snorri留言2014年6月11日 (三) 04:07 (UTC)

搜索引擎与网站间网络结构:基于能见指数的分析

百科全书网站和百科全书网站的跨中文本地化关系,已有中文版供社群朋友们阅读批评。在此感谢 武汉大学 信息资源研究中心 的博士生 张斌的大力编辑及润稿。此中文全文已投武汉大学所举办的一学术研讨会。文件下载:[2]--❦维基vs百度来源专题 hanteng 2014年6月14日 (六) 08:06 (UTC)

Portal:中国共产党正式建立!!!

请对本主题有兴趣的维基人进行完善!!!有兴趣请移步Portal:中国共产党--Ds950524留言2014年6月13日 (五) 09:14 (UTC)

谢谢你理解维基专题不应该拿来做公关(任何有中国共产党党员身份的人要注意WP:COI),而是展示有意义的知识。我做了此编辑[3]而你补上[4],这样比较有让读者做多方解读的空间。祝好运。--❦维基vs百度来源专题 hanteng 2014年6月14日 (六) 08:10 (UTC)

待我更新完Portal:化学/Did you know/存档之后,我会在Wikipedia:新条目推荐中寻找与中国共产党相关的DYK并放入Portal:中国共产党/Did you know中。另外(*)提醒一下主题创建者不要忘记在{{portals}}中的合适位置加入您所创建的主题。--To be №.N 2014年6月14日 (六) 14:49 (UTC)

Wikidata weekly summary #113

中国如何和世界互动:全球事件数据库GDELT的视觉化试作

全球事件数据库GDELT,收集了近几十年来的新闻事件并加以情绪、地理、及行动者的相关编码。译言有一篇介绍在过去的三十年,新闻报道如何影响了我们的世界观

我最近也试用了一下,跑了一下今年六四之前一个月的新闻并视觉化,结果在此[5]。若有人有兴趣试做或试改,相关程式码及说明见此[6]

我在Wikipedia:互助客栈/技术提问如何能有系统地从维基资源取得类似的新闻事件的资料点?动机是�由于GDELT的资料或有其英文中心或偏向的问题,所以我在思考如何从不同语种的维基资源中有系统地撷取类似的资料点。--❦维基vs百度来源专题 hanteng 2014年6月16日 (一) 08:40 (UTC)

台湾维基分会在2014开源人年会上有摊位

感谢 COSCUP 2014 开源人年会主办单位,今年中华民国维基媒体协会有正式摊位,欢迎想了解 Wikipedia 维基百科相关媒体计划的朋友们,到时候一起来摊位上与维基人聊天。--章安德鲁留言2014年6月17日 (二) 03:38 (UTC)

  • 主办地点不错喔,是中研院很新的大楼,常用来办国际会议的。后面还有一个小山丘和农家,想运动看夜景的人还可以一路从中华工专的入山口健行到四兽山。可惜我七月就要回欧洲准备口试了,不过若有人要在台北组织wikipedia hackathon,找我。主办地点交通方面是不如台北其他地方方便,不过中南部的学术界朋友可以试试看中研院到几个大学的专车看能不能用的上喔。--❦维基vs百度来源专题 hanteng 2014年6月17日 (二) 06:36 (UTC)

华语微博用户拿百度百科和维基百科作啥?

[7]为回答此问题,我从信息接触/资讯参与(information engagement)的角度分析了由 香港大学WeiboScope及Texifter.com提供的DiscoverText – 微博数据集,一共超过40,000微博帖子。若旅行经费顺利找著,我将在今年在柏林的Opensym2014宣读并展示研究结果。英文论文连结[8]。--❦维基vs百度来源专题 hanteng 2014年6月17日 (二) 06:39 (UTC)

问:蒋勋先生生平

今(2014/6/18)日找寻蒋勋先生相关资料时,却发现在条目上注明他已于2010年去世,但蒋勋先生尚未去世,近期内亦有参加过他的演讲,可烦请更动之大德将其复原,谢谢。 --Tseng29留言2014年6月18日 (三) 03:10 (UTC)

使用方针修订:公开有偿编辑

维基媒体基金会已经正式发布了修正后的方针修订,任何通过编辑获得报酬的行为都需要以指定的方式公开。--♥VC XC 2014年6月17日 (二) 07:18 (UTC)

部分测试功能即将在中文维基百科全面试用

今天与基金会技术团队交流,得知很可能在本月底或下月初,在包括中文维基百科在内的数个语言版本全面试用包括“悬停卡片”、“简洁用户栏”、“媒体文件查看器”、“新搜索”等测试功能。届时这些功能将对所有用户设置为默认启用,但可以在设置中关闭。目前未决定这些功能是一起启用还是分批启用,但对方表示,它们都已经进入开发完毕的收尾阶段,并鼓励用户前往参数设置里尽早体验,以提报可能存在的BUG。--♥VC XC 2014年6月13日 (五) 03:31 (UTC)

“新搜索”早就默认启用了搞错了...--百無一用是書生 () 2014年6月13日 (五) 06:18 (UTC)
“悬停卡片”目前不支持繁简转换。而且悬停卡片下方的“最后编辑于xxx”的xxx无法汉化(我找了半天也没找到在哪里改)--百無一用是書生 () 2014年6月13日 (五) 06:54 (UTC)
你看到的是之前用户的繁简设置……bugzilla:66621。后面一半  无法重现Liangent留言 2014年6月14日 (六) 18:19 (UTC)
移到书生君用户页连接写有“最后编辑于a month ago”这叫  无法重现,呵呵。--Liuxinyu970226留言2014年6月15日 (日) 03:21 (UTC)
话说zhwp会有帮助:图书吗?——C933103(留言) 2014年6月20日 (五) 05:52 (UTC)

Wikidata weekly summary #114

瓦莱瓦莱文维基百科成为百万大户

刚刚传来的消息,瓦莱瓦莱文维基百科藉著刷生物条目成功成为百万大户。馀下的我就不说了,留待大家商议。--春卷柯南夫子 ( ) 2014年6月9日 (一) 14:04 (UTC)

哈→哈→哈↘。——路过围观的Sakamotosan 2014年6月10日 (二) 00:30 (UTC)

那宿雾语怎么办,LSJbot打算放弃它了吗?--向端粒向酶解投上冷冷的一眼骑士呵,向前2014年6月10日 (二) 03:33 (UTC)

哈!宾宾的机械人果然利害。只有77名活跃用户的百科,竟然刷了百多万个条目。超越英语维基真的是指日可待啦!XD --Qui cherche trouve 2014年6月10日 (二) 03:49 (UTC)
没有质量的数量,不要也罢--180.155.69.97留言2014年6月10日 (二) 06:30 (UTC)
但人总要脸,没质量的话只能打肿双面充胖子。——路过围观的Sakamotosan 2014年6月10日 (二) 07:24 (UTC)
枪打出头鸟,它以这样的速度增长,相信很快会有管理层留意。--Qui cherche trouve 2014年6月10日 (二) 07:43 (UTC)
希望基金会拨乱反正,然后刷过的退回去或者一纸禁令?呵呵,希望吧。倒不如找wing提议下,或者想办法在不影响现有条目质与量的情况,冲击一下吧。——路过围观的Sakamotosan 2014年6月10日 (二) 08:57 (UTC)
不是两年前就有人说要跟基金会说么。说没说忘了...--lavixcanvas Fight On M T C 2014年6月10日 (二) 09:29 (UTC)
我记得有人说过老大哥曾经公开场合支持机器人刷条目的行为。--Walter Grassroot () 2014年6月10日 (二) 09:35 (UTC)
条目数多有什么价值?能向基金会申请更多的资源吗?或者提升某些语言的国际地位?--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月11日 (三) 01:52 (UTC)
规模效应啊。瓦莱瓦莱哇,亚细亚一番哟!—Snorri留言2014年6月11日 (三) 01:58 (UTC)
小小菲国有美帝撑腰,竟然真的狐假虎威起来了!--Qui cherche trouve 2014年6月11日 (三) 02:14 (UTC)
唉,真是可笑复可悲。—Snorri留言2014年6月11日 (三) 02:19 (UTC)
我在想象排名低于中文的版本发生的事情:(==这人为何不去刷塔加洛语版)适当修改代码后,它确定了下一个双刷目标是(以下之1~2):奥克语版皮埃蒙特语版海地语版布吉语版Samogitian语版Banyumasan语版。--Liuxinyu970226留言2014年6月10日 (二) 09:20 (UTC)
瓦莱瓦莱语是红连,是否应该为它建立一个条目,让大家知道甚么国家的人在使用,使用人口有多少?别外,我真的很想废掉香港语粤语维基百科,不堪入目--Dragoon17cc留言2014年6月10日 (二) 18:28 (UTC)
瓦瑞瓦瑞语,菲律宾方言。--Qui cherche trouve 2014年6月11日 (三) 01:24 (UTC)
粤语应该要介绍有关自己语言文化风俗,而不是愚昧地重复创建中文维基有的学科条目,这是我对方言百科的看法,况且基本上中文维基就应该包含所有方言有的条目__^ 2014年6月11日 (三) 04:21 (UTC)
每次看到机器人刷条目就想到摆渡百科。--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月11日 (三) 01:50 (UTC)
青山不改,绿水长流……--Qui cherche trouve 2014年6月11日 (三) 02:10 (UTC)
这是什么巫术?(越南语哭哭啰)__^ 2014年6月11日 (三) 04:14 (UTC)
越南语也开始行动了vi:Special:NewPages。条目数目前是935360个,比十几天前多了两万个。今天已经建了六千个条目。--GZWDer留言2014年6月11日 (三) 05:13 (UTC)
这是一场Cheers!-bot 和 LSJbot两人的斗争。--Walter Grassroot () 2014年6月11日 (三) 06:06 (UTC)
机器人需要人操作还是可以自运?应该不用休息吧?挖了一下vi:Special:NewPages,第一枪从2014/6/10 14:33一直到22:00(似乎是UTC),隔天02:29又开始刷到07:52,最快时在03:30左右每分钟19页。是说维基是共用伺服器还是有分语言?__^ 2014年6月11日 (三) 10:16 (UTC)
维基媒体基金会有137台应用程序服务器运行Apache+PHP,对不同语言不同项目提交的请求都会被负载均衡到这些服务器上,不存在“分语言”这一说法,甚至同一用户两次修改一个页面的两个请求都是由不同的服务器处理的。话说每台服务器每秒处理20-40个请求,总共每秒处理3000-6000个请求,“每分钟19页”根本不算什么。参见ganglia--180.155.69.97留言2014年6月12日 (四) 05:09 (UTC)
真不愧是机器人,创出简洁有力的条目。--跃(留言)☜DC12 2014年6月12日 (四) 12:24 (UTC)
再请教一下,机器人创页面的资料都哪里来的,自动翻译其他语言吗?这样不就会有拙劣翻译问题?(war:special:newpages还在搞,速度慢很多就是了,这样下去我赌干杯-僵尸!会赢←谷歌老兄的翻译)__^ 2014年6月12日 (四) 12:41 (UTC)
神圣的大便!这就是真相吗?一个凄美的爱情故事造就了第一个突破百万的亚洲语言?(泣__^ 2014年6月12日 (四) 12:55 (UTC)

请读并加入Wiki-research-l Quality on different language version的讨论。--❦维基vs百度来源专题 hanteng 2014年6月13日 (五) 19:13 (UTC)

我在想今年wikimania的时候要怎么办…… --达师 - 277 - 465 2014年6月21日 (六) 04:36 (UTC)

有什么问题吗?--管闲事且对地图炮具有100%抗性的朝鲜的轮子留言2014年6月21日 (六) 14:00 (UTC)

中文维基百科条目增速彻底慢了。E100C留言2014年6月22日 (日) 16:17 (UTC)

以后的条目都小作品就好了,这样创立比较迅速果决,遵守规定才免于快速删除。--Jisiko11留言2014年6月25日 (三) 14:42 (UTC)
果真是迅速果决啊- - 首先对于此版本的wikipedia表示热烈祝贺,另外(...)这样的方法还是很不错的吧......

2014年4月维基媒体亮点

亮点来源于2014年4月维基媒体基金会报告维基媒体工程报告,以及其他重要的维基媒体活动事件
 

—以上未签名的留言是于2014年6月27日 (五) 14:42 (UTC)之前加入的。

80万条目所用标志

中文维基百科将突破80万条目时所用标志是什么?Joe young yu留言2014年6月28日 (六) 10:19 (UTC)

参考WP:ST,还有至少130天,现在想这个是不是太早了?--Azunyan(留言) 2014年6月29日 (日) 07:23 (UTC)

Wikidata weekly summary #115