國(guó)際上比較重要的核酸(含蛋白質(zhì))一級(jí)數(shù)據(jù)庫(kù)有美國(guó)的GenBank、歐洲的EMBL和日本的DDBJ。三個(gè)數(shù)據(jù)庫(kù)信息共享,每日交換,故資料是一樣的,唯格式有所不同。中國(guó)的DNA系統(tǒng)是最近10年間才發(fā)展起來(lái)的,DNA數(shù)據(jù)庫(kù)系統(tǒng),有數(shù)據(jù)量大,增長(zhǎng)量快,比對(duì)復(fù)雜等特點(diǎn)。
GenBank是美國(guó)國(guó)家生物技術(shù)信息中心建立的DNA序列數(shù)據(jù)庫(kù),從公共資源中獲取序列數(shù)據(jù),主要是科研人員直接提供或來(lái)源于大規(guī)?;蚪M測(cè)序計(jì)劃。為保證數(shù)據(jù)盡可能的完全,GenBank與EMBL、DDBJ建立了相互交換數(shù)據(jù)的合作關(guān)系。
EMBL是歐洲生物信息學(xué)研究所(European Bioinformatics Institute, EBI)創(chuàng)建的一個(gè)核酸序列數(shù)據(jù)庫(kù)。EMBL的數(shù)據(jù)來(lái)源主要有兩部分,一部分由科研人員或某些基因組測(cè)序機(jī)構(gòu)通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)直接提交,另一部分則來(lái)自科技文獻(xiàn)或?qū)@?br />DDBJ是DNA Data Bank of Japan的簡(jiǎn)稱,始建于1986年,由日本國(guó)立遺傳學(xué)研究院負(fù)責(zé)數(shù)據(jù)庫(kù)的建設(shè),維護(hù)及數(shù)據(jù)的傳播,并與EMBL和GenBank合作;可以從世界各地通過(guò)網(wǎng)絡(luò)把序列直接提交該數(shù)據(jù)庫(kù)。DDBJ網(wǎng)頁(yè)上也提供了包括FastA和BLAST在內(nèi)的數(shù)據(jù)庫(kù)查詢工具。
此外,較大型的數(shù)據(jù)庫(kù)還有日本的dbEST以及美國(guó)的GSDB,dbEST有自己的格式和識(shí)別代碼系統(tǒng),序列信息以及dbEST的注釋摘要,也按DNA的分類分成了若干子數(shù)據(jù)庫(kù)。GSDB由位于新墨西哥州Santa Fe的國(guó)家基因組資源中心創(chuàng)建。GSDB收集、管理并且發(fā)送完整的DNA序列及其相關(guān)信息,以滿足主要基因組測(cè)序機(jī)構(gòu)的需要。
除了涵蓋從完整基因組到單個(gè)基因各個(gè)方面的綜合DNA序列數(shù)據(jù)庫(kù),還有些更有針對(duì)性的基因組資源,或稱專用數(shù)據(jù)庫(kù)。它們主要的目的是為某一特定的物種提供一個(gè)更為完整的數(shù)據(jù)庫(kù)資源,如模式生酵母、 線蟲(chóng)、果蠅、擬南芥、幽門螺桿菌等。