打开主菜单

数据科学英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品[1]。它结合了诸多领域中的理论和技术,包括应用数学统计模式识别机器学习数据可视化数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学社会科学人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助[2]

歷史编辑

1960年代,Peter Naur 就首次提議要用「數據科學(data science、Datalogy)」來替代「計算機科學(computer science)」,後來在上世紀九十年代中期為國際分類社團聯盟所用。

2001 年,William S. Cleveland 提議將其設立為一個新的學科,吸收「計算在數據方面取得的進展」作為統計學的延伸。《數據科學(Data Science Journal )》及《The Journal of Data Science》分別於 2002 年與 2003 年發行;2005 年,國家科學委員會發表了《數字數據收集萬歲:促進二十一世紀的研究與教育》,文中將數據科學家定義為「訊息與計算機科學家,資料庫與軟體工程師及程序員,學科專家,成功管理數字數據收集的關鍵人物。」

2008年Jeff Hamerbatcher與DJ Patil circa分別在FACEBOOK、Linkedin領導全球第一支數據科學團隊,全球首次有「數據科學」的概念出現。至此數據科學越來越被廣泛流行,並應用到公衛、市場、金融、社會等各個領域。

数据科学家编辑

數據科學家這個職位的頭銜則是 2009 年由 Natahn Yau 首次提及的,他認為數據科學家就是能夠從大型數據集中析取出數據,並提供某些可供非數據專家使用的東西的人。

2009 年 1 月,數位化數據跨機構工作組發表了一份名為《駕馭科學與社會數字化數據之力》的報告,Sadkowsky 從中了解到「數據科學家」這個詞,認為該詞是自己所從事工作的最好描述。

数据科学家被《哈佛商業評論》称为《二十一世纪最性感的职业》[3]後,數據科學逐漸成為一個時髦術語(英語:Buzzword)。

数据科学家在美欧的需求巨大,麥肯錫公司宣布全世界上此职业人才短缺超过二十万工人[4]。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

参考文献编辑