Kaggle是一个数据建模数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实,即有众多策略可以用于解决几乎所有预测建模的问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。Kaggle的目标则是试图通过众包的形式来解决这一难题,进而使数据科学成为一场运动。2017年3月8日谷歌官方博客宣布收购Kaggle[1]

Kaggle
公司類型子公司
成立2010年4月
創辦人安东尼·戈德布卢姆
代表人物安东尼·戈德布卢姆 (CEO)
马克斯·列夫琴 (董事局主席)
杰夫·莫泽 (CTO)
總部 美國旧金山
標語口號Making Data Science a Sport
使数据科学成为一项运动
产业预测建模
所有權者Alphabet
母公司Google LLC
网站www.kaggle.com

竞赛流程 编辑

Kaggle中组织一场竞赛的过程如下。

  1. 竞赛主持人准备数据和问题的描述。Kaggle对这一过程以及竞赛的建构、数据的匿名化以及集成最终获胜的模型提供咨询服务。
  2. 参与者通过不同的方法进行实验,相互竞赛以获得最优的模型。对于大多数的参与者,他们的提交会根据预测精度被立即评分,并在实时的积分榜上显示。
  3. 在截止时间过后,竞赛主持人为“全球性的,永久性的,不可撤销和免版税地使用获奖作品”支付奖金。亦即竞赛获胜者的算法、软件和相关的知识产权是非排他性的,除非特别指明[2]

除了公开竞赛以外,Kaggle还向活跃参与者提供私下的比赛,以及为大学团体提供Kaggle-in-Class项目[3]

影响 编辑

根据Kaggle官方提供的数据,Kaggle在全球范围内拥有将近20万名数据科学家,专业领域从计算机科学到统计学、经济学和数学[4]。Kaggle也曾经和NASA维基百科德勤好事达英语Allstate合作举办竞赛。其中的一项奖项高达300万美金的竞赛是Heritage Health Prize,目的是通过病人看病及吃药住院等数据预测明年病人住院的天数[5]。另一项与微软合作的竞赛则旨在提高Kinect的手势识别精度[6]

Kaggle的競賽在愛滋病研究[7]、棋牌评级[8]和交通预测[9]方面取得了成果。基于这些成果产生了一系列的学术论文。产生这一结果的原因是实时积分榜促使参加者不断改进以试图超越当前的最佳实践[10]。获胜的方法常常在Kaggle的博客No Free Hunch页面存档备份,存于互联网档案馆)上展示。

融资 编辑

2011年,Kaggle从创办地澳大利亚墨尔本搬迁到美国旧金山,并在11月宣布向硅谷投资者进行规模为1100万美元的首轮融资。指数风险投资公司英语Index Ventures科斯拉风险投资公司英语Khosla Ventures成为Kaggle最大的股东,而PayPal联合创始人马克斯·列夫琴也参加了该轮投资并成为Kaggle的董事局主席。另一位著名的投资人是经济学家,Google首席经济师哈尔·范里安。他称Kaggle提供了一种“将全世界最有才能的数据科学家组织起来并使各种规模的机构都能够触及”的方式[11]

参见 编辑

参考资料 编辑

  1. ^ Welcome Kaggle to Google Cloud页面存档备份,存于互联网档案馆).[2017-03-08].
  2. ^ Kaggle. Terms and Conditions - Kaggle. [2014-09-13]. (原始内容存档于2021-01-11). 
  3. ^ Kaggle. Kaggle in Class. [2014-09-13]. (原始内容存档于2011-06-16). 
  4. ^ Kaggle. About Us. [2014-09-13]. (原始内容存档于2011-07-27). 
  5. ^ Healthy Competition. The Economist. April 10, 2011 [3 May 2011]. (原始内容存档于2016-03-12). 
  6. ^ Byrne, Ciara. Kaggle launches competition to help Microsoft Kinect learn new gestures. VentureBeat. December 12, 2011 [13 December 2011]. (原始内容存档于2020-09-28). 
  7. ^ Carpenter, Jennifer. May the Best Analyst Win. Science Magazine. February 2011 [1 April 2011]. (原始内容存档于2015-09-24). 
  8. ^ Sonas, Jeff. The Deloitte/FIDE Chess Rating Challenge. Chessbase. 20 February 2011 [3 May 2011]. (原始内容存档于2012-11-09). 
  9. ^ Foo, Fran. Smartphones to predict NSW travel times?. The Australian. April 6, 2011 [3 May 2011]. (原始内容存档于2019-10-08). 
  10. ^ Athanasopoulos, George; Hyndman, Rob. The Value of Feedback in Forecasting Competitions (PDF) 27. 2011: 845–849 [2021-02-07]. (原始内容存档 (PDF)于2019-02-16).  |journal=被忽略 (帮助)
  11. ^ Rao, Leena. Index And Khosla Lead $11M Round In Kaggle, A Platfogasgsgrm For Data Modeling Competitions. TechCrunch. November 2, 2011 [13 December 2011]. (原始内容存档于2020-10-23). 

扩展阅读 编辑

外部链接 编辑