基因銀行GenBank)是一個開放獲取序列數據庫英語sequence database,對所有公開可利用的核苷酸序列與其翻譯的蛋白質進行收集並註釋。

GenBank
內容
有機體所有
相關信息
研究中心NCBI
發佈日期1982年
訪問入口
數據格式
網站NCBI
下載地址ncbi ftp
網絡服務地址
工具
WebBLAST
StandaloneBLAST
其他
許可Public domain-US Government

此數據庫是國際協作核酸序列數據庫英語International Nucleotide Sequence Database Collaboration(INSDC)的一部分,由美國國家生物技術信息中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的數據。

成立三十年來,GenBank數據庫成為了最重要的也是最有影響力的生物全領域數據庫,其數據正被全球數以百萬計的研究人員獲取與引用。GenBank中的數據量正以每18個月翻一番的速度持續指數增長[1][2],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]

歷史 編輯

1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組頁面存檔備份,存於互聯網檔案館)的Walter Goad英語Walter Goad等人建立了洛斯阿拉莫斯序列數據庫,最終成為了公共的 GenBank數據庫的前身[4]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。

在20世紀80年代中期,史丹福大學的Intelligenetics bioinformatics公司與LANL合作經營着GenBank項目[5]。作為最早的互聯網生物信息學社區項目,GenBank計劃為生物學家打造一個開放獲取BIOSCI英語BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術信息中心[6]

 
Genbank和EMBL在1986/1987年出版的《核苷酸序列》I到VII卷
 
Genbank v100版本的CDRom

發展 編輯

 
GenBank中鹼基對數目的增長,1982年到2018年,半對數圖.

在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[7]

截至2013年7月8日 (2013-07-08),GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[3]。 GenBank數據庫還包括一些額外的數據集,不包括在這個統計內。

GenBank中鹼基數前二十的物種(版本 191)[8]
物種 鹼基對
智人 Homo sapiens 1.6310774187×10^10
小家鼠 Mus musculus 9.974977889×10^9
褐鼠 Rattus norvegicus 6.521253272×10^9
家牛 Bos taurus 5.386258455×10^9
玉米 Zea mays 5.062731057×10^9
野豬 Sus scrofa 4.88786186×10^9
斑馬魚 Danio rerio 3.120857462×10^9
紫色球海膽英語Strongylocentrotus purpuratus Strongylocentrotus purpuratus 1.435236534×10^9
普通獼猴 Macaca mulatta 1.256203101×10^9
水稻 Oryza sativa Japonica Group 1.255686573×10^9
紅花煙草 Nicotiana tabacum 1.197357811×10^9
非洲爪蟾 Xenopus (Silurana) tropicalis 1.249938611×10^9
黑腹果蠅 Drosophila melanogaster 1.11996522×10^9
黑猩猩 Pan troglodytes 1.008323292×10^9
擬南芥 Arabidopsis thaliana 1.144226616×10^9
家犬 Canis lupus familiaris 951,238,343
釀酒葡萄 Vitis vinifera 999,010,073
原雞 Gallus gallus 899,631,338
大豆 Glycine max 906,638,854
普通小麥 Triticum aestivum 898,689,329

另見 編輯

參考文獻 編輯

  1. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942 . PMID 18073190. doi:10.1093/nar/gkm929. 
  2. ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462 . PMID 18940867. doi:10.1093/nar/gkn723. 
  3. ^ 3.0 3.1 GenBank release notes. NCBI. [2013-12-02]. (原始內容存檔於2016-12-22). 
  4. ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始內容存檔於2008-11-07). 
  5. ^ LANL GenBank History. [2013-12-02]. (原始內容存檔於2016-03-03). 
  6. ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520 . PMID 2326192. doi:10.1093/nar/18.6.1517. 
  7. ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190 . PMID 23193287. doi:10.1093/nar/gks1195. (原始內容存檔於2020-05-14). 
  8. ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681 . PMID 21071399. doi:10.1093/nar/gkq1079. 


外部連結 編輯