打开主菜单

数据科学英语:data science)是一门利用数据学习知识的学科,其目标是通过从数据中提取出有价值的部分来生产数据产品[1]。它结合了诸多领域中的理论和技术,包括应用数学统计模式识别机器学习数据可视化数据仓库以及高性能计算。数据科学通过运用各种相关的数据来帮助非专业人士理解问题。 数据科学技术可以帮助我们如何正确的处理数据并协助我们在生物学社会科学人类学等领域进行研究调研。此外,数据科学也对商业竞争有极大的帮助[2]

歷史编辑

1960年代,Peter Naur 就首次提議要用「數據科學(data science、Datalogy)」來替代「計算機科學(computer science)」,後來在上世紀九十年代中期為國際分類社團聯盟所用。

In November 1997, 吴建福 gave the inaugural lecture entitled "Statistics = Data Science?"[3] for his appointment to the H. C. Carver Professorship at the University of Michigan.[4] In this lecture, he characterized statistical work as a trilogy of data collection, data modeling and analysis, and decision making. In his conclusion, he initiated the modern, non-computer science, usage of the term "data science" and advocated that statistics be renamed data science and statisticians data scientists.[3] Later, he presented his lecture entitled "Statistics = Data Science?" as the first of his 1998 P.C. Mahalanobis Memorial Lectures.[5] These lectures honor Prasanta Chandra Mahalanobis, an Indian scientist and statistician and founder of the Indian Statistical Institute.

2001 年,William S. Cleveland 提議將其設立為一個新的學科,吸收「計算在數據方面取得的進展」作為統計學的延伸。《數據科學(Data Science Journal )》及《The Journal of Data Science》分別於 2002 年與 2003 年發行;2005 年,國家科學委員會發表了《數字數據收集萬歲:促進二十一世紀的研究與教育》,文中將數據科學家定義為「訊息與計算機科學家,資料庫與軟體工程師及程序員,學科專家,成功管理數字數據收集的關鍵人物。」

2008年Jeff Hamerbatcher與DJ Patil circa分別在FACEBOOK、Linkedin領導全球第一支數據科學團隊,全球首次有「數據科學」的概念出現。至此數據科學越來越被廣泛流行,並應用到公衛、市場、金融、社會等各個領域。

数据科学家编辑

數據科學家這個職位的頭銜則是 2009 年由 Natahn Yau 首次提及的,他認為數據科學家就是能夠從大型數據集中析取出數據,並提供某些可供非數據專家使用的東西的人。

2009 年 1 月,數位化數據跨機構工作組發表了一份名為《駕馭科學與社會數字化數據之力》的報告,Sadkowsky 從中了解到「數據科學家」這個詞,認為該詞是自己所從事工作的最好描述。

数据科学家被《哈佛商業評論》称为《二十一世纪最性感的职业》[6]後,數據科學逐漸成為一個時髦術語(英語:Buzzword)。

数据科学家在美欧的需求巨大,麥肯錫公司宣布全世界上此职业人才短缺超过二十万工人[7]。《The Data Incubator》国际企业,在硅谷纽约成立,提供国际大数据和数据科学培训服务。

参考文献编辑

  1. ^ Dhar, Vasant. Data Science and Prediction. 
  2. ^ AOL staff. Data Scientist: The Hottest Job You Haven't Heard Of. 
  3. ^ 3.0 3.1 Wu, C. F. J. (1997). Statistics = Data Science? (PDF). [9 October 2014]. 
  4. ^ Identity of statistics in science examined. The University Records, 9 November 1997, The University of Michigan. [12 August 2013]. 
  5. ^ P.C. Mahalanobis Memorial Lectures, 7th series. P.C. Mahalanobis Memorial Lectures, Indian Statistical Institute. [18 Jul 2017]. (原始内容存档于29 October 2013). 
  6. ^ Data Scientist: The Sexiest Job of the 21st Century. 
  7. ^ Big data: The next frontier for innovation, competition, and productivity.