千人基因組計劃首批發(fā)布的數(shù)據(jù)集就達到了兩百多TB(terabyte),遠遠大于絕大多數(shù)本地計算機環(huán)境。將這些數(shù)據(jù)放到了云端上,可以方便不同地區(qū)的研究人員能夠同時進行復雜的數(shù)據(jù)分析。
云技術的一個主要優(yōu)勢就是,一旦數(shù)據(jù)集上傳到云端,所有人都可以在那里使用它。人們只需要在云上簡單設立自己的“虛擬主機”,就可以獲得強大的計算能力。近來,測序儀生產商正在加緊向云端進軍,為用戶提供各種各樣的云計算解決方案。測序巨頭Illumina(MiSeq、HiSeq和NextSeq測序系統(tǒng)的制造者),已經建立了一個稱為BaseSpace的云平臺。該平臺為Illumina用戶提供了數(shù)據(jù)儲存服務和一系列的分析工具,包括基因組瀏覽器、比對工具、變異檢出工具等等,這些都已經整合在Illumina測序系統(tǒng)的標準工作流程中。