文化組學(英語:culturomics)是指通過電子化文本的量化分析研究人類行為與文化趨勢的計算詞典學英語computational lexicology方法。[1][2]研究者對海量數字檔案進行數據挖掘以研究人們使用的語言與詞彙,進而揭示其中反應出來的文化現象。[3]「文化組學」一詞是2010年創造的新詞,由英文中的「文化」(culture)與「組學」(omics)二詞合併而成,當年《自然》上發表的《通過海量電子化書籍對文化進行量化分析》(Quantitative Analysis of Culture Using Millions of Digitized Books)一文首次提出了該詞。論文的作者為哈佛大學學者讓-巴蒂斯特·米歇爾(Jean-Baptiste Michel)與埃雷茲·利柏曼·埃登(Erez Lieberman Aiden)。[4]

米歇爾與埃登還參與了Google實驗室的項目Google Ngram Viewer。這個項目通過n元語法(n-gram)分析Google圖書中的數據,以展示語言中的文化模式隨時間的變化。

參考文獻 編輯

  1. ^ Cohen, Patricia. In 500 Billion Words, New Window on Culture. New York Times. 16 December 2010 [2016-10-16]. (原始內容存檔於2021-02-13). 
  2. ^ Hayes, Brian. Bit Lit. American Scientist. May–June 2011, 99 (3): 190. doi:10.1511/2011.90.190. (原始內容存檔於2016-10-18). 
  3. ^ Letcher, David W. Cultoromics: A New Way to See Temporal Changes in the Prevalence of Words and Phrases (PDF). American Institute of Higher Education 6th International Conference Proceedings. April 6, 2011, 4 (1): 228 [2016-10-16]. (原始內容 (PDF)存檔於2016-03-03). 
  4. ^ Michel, Jean-Baptiste; Liberman Aiden, Erez. Quantitative Analysis of Culture Using Millions of Digitized Books. Science. 16 December 2010, 331 (6014): 176–82 [2016-10-16]. PMC 3279742 . PMID 21163965. doi:10.1126/science.1199644. (原始內容存檔於2012-04-24). 

外部連結 編輯