http://www.physorg.com/news/2011-11-galaxy-dna-analysis-software-cloud.html
November 8, 2011
Galaxy -- 一款開放原碼、基於網站的平台,用於資料密集的生醫與遺傳研究 -- 現已成為一種可供存取的「雲端運算」資源。一個包括 Anton Nekrutenko(賓州州立大學生物化學與分子生物學副教授)、Kateryna Makova(賓州大生物學副教授)、與來自 Emory 大學的 James Taylor 的團隊,開發出這種新技術,那將幫助科學家與生醫研究者駕馭如 DNA 定序及分析軟體這樣的工具,以及大量科學資料的儲存能力。開發細節將在 Nature Biotechnology 期刊上以一篇通訊(letter)的形式發表。
早先由 Nekrutenko 與共同作者所完成的論文,那描述這項技術以及它的使用,已發表在 Genome Research 與 Genome Biology 期刊中。
Nekrutenko 表示,他與他的團隊首先在 2005 年開發出 Galaxy computing system (http://galaxyproject.org) ,因為「生物學處於休克狀態」。生物化學與生物實驗室產生堆積如山的資料,然後科學家納悶,"我們現在該做什麼?這些資料我們該如何分析?" Galaxy(那在賓州大開發並持續使用該大學的伺服器作為其運算力來源)解決了許多問題,這些問題研究者得要將各種工具兜在一起才能使大量資料的檢索與分析更容易,簡化了基因組分析的過程。如同在該團隊其中一篇刊載於 Genome Research 期刊之早期論文所描述的,Galaxy "將現有基因組註記(genome-annotation)資料庫的力量與一個簡單的入口網站結合起來,讓使用者能夠搜尋遠端資源,從獨立查詢結合資料,並將結果視覺化。" Galaxy 也能讓其他研究者能夠複審已經完成的步驟,例如,在一串遺傳密碼的分析中。"Galaxy 提供科學上的透明度 -- 能創造出一份公開的分析報告的選項。所以在論文發表後,其他實驗室的科學家得以進行研究以重現所描述的結果," Nekrutenko 表示。
現在,Nekrutenko 的團隊藉由開發出一種「步入雲端」的選項,利用,例如,熱門的 Amazon Web Services 雲,把 Galaxy 帶往另一個層次。"雲端基本上是一個強大電腦的網路,那能在遠端存取而不需要擔憂發熱、冷卻與系統管理。這樣一套系統允許使用者,不管他們身處何處,都能將軟體儲存、資料儲存與硬體基礎建設的工作量轉移到這個位於遠端的網路化電腦上," Nekrutenko 解釋。"使用者既不是在自己的電腦上跑 Galaxy 也不是使用賓州大的伺服器來存取 Galaxy,現在,一位研究者能駕馭雲端的力量,那允許幾乎沒有限制的運算力。" 身為一項個案研究,作者們在最近的研究中報告(那發表在 Genome Biology 上),科學家在 Ian Paul(賓州大 Hershey 醫學中心的兒科教授)的幫助下,利用 Galaxy Cloud 分析橫跨三個家族九位個體的 DMA。由於該平台巨大的運算能力,研究者才能確認四個異質性位置(heteroplasmic sites) -- 為於粒線體中的變異(粒線體那部份的基因組只由母親遺傳給小孩)。
"除了顯而易見的以外,例如:對於大量資料的運算能力、科學家不必經過太多電腦訓練就能夠使用 DNA 分析工具,Galaxy Cloud 還提供諸多優勢," Nekrutenko 表示。"例如,研究者不需要投資昂貴的電腦基礎建設,就能夠完成資料密集、複雜的科學分析。"
Galaxy Cloud 另一項優勢在於其資料儲存能力。利用 Amazon Web Services 雲,研究者可以選擇將龐大的資料儲存在安全的地點。"目前正在浮現的技術,其所產生的資料將比現有的「次世代」 DNA 定序多出百倍,那已經到了儲存本身就成為一個問題,更遑論分析的地步了," Nekrutenko。
※ 相關報導:
* Harnessing cloud computing with Galaxy Cloud
http://www.nature.com/nbt/journal/v29/n11/full/nbt.2028.html
Enis Afgan, Dannon Baker, Nate Coraor, Hiroki Goto,
Ian M Paul, Kateryna D Makova, Anton Nekrutenko, James Taylor
Nature Biotechnology 29, 972–974 (2011)
doi: 10.1038/nbt.2028
* Galaxy: A platform for interactive large-scale genome analysis
http://genome.cshlp.org/content/15/10/1451.abstract
Belinda Giardine, Cathy Riemer, Ross C. Hardison,
Richard Burhans, Laura Elnitski, Prachi Shah, Yi Zhang,
Daniel Blankenberg, Istvan Albert, James Taylor, Webb Miller,
W. James Kent, and Anton Nekrutenko
Genome Res. 2005. 15: 1451-1455
doi: 10.1101/gr.4086505
* A framework for collaborative analysis of ENCODE data: making large-scale analyses biologist-friendly
http://genome.cshlp.org/content/17/6/960.abstract
Daniel Blankenberg, James Taylor, Ian Schenck, Jianbin He,
Yi Zhang, Matthew Ghent, Narayanan Veeraraghavan,
Istvan Albert, Webb Miller, Kateryna D. Makova,
Ross C. Hardison, and Anton Nekrutenko
Genome Res. 2007. 17: 960-964
doi: 10.1101/gr.5578007
* 28-Way vertebrate alignment and conservation track in the UCSC Genome Browser
http://genome.cshlp.org/content/17/12/1797
Webb Miller, Kate Rosenbloom, Ross C. Hardison, Minmei Hou,
James Taylor, Brian Raney, Richard Burhans, David C. King,
Robert Baertsch, Daniel Blankenberg,
Sergei L. Kosakovsky Pond, Anton Nekrutenko, Belinda Giardine,
Robert S. Harris, Svitlana Tyekucheva, Mark Diekhans,
Thomas H. Pringle, William J. Murphy, Arthur Lesk,
George M. Weinstock, Kerstin Lindblad-Toh, Richard A. Gibbs,
Eric S. Lander, Adam Siepel, David Haussler, and
W. James Kent.
Genome Res. 2007. 17: 1797-1808
doi: 10.1101/gr.6761107
* Dynamics of mitochondrial heteroplasmy in three families investigated via a repeatable re-sequencing study
http://genomebiology.com/2011/12/6/R59/abstract
Hiroki Goto, Benjamin Dickins, Enis Afgan, Ian M Paul,* 新計算技術讓基因組的比對更加容易
James Taylor, Kateryna D Makova and Anton Nekrutenko
Genome Biology 2011, 12:R59
doi: 10.1186/gb-2011-12-6-r59
* 研究者為突變發現開發全基因組定序
* 簡化的「複雜性」 -- 基因組如何作用的新洞見
* 科學家發現新的遺傳次密碼
* 我們的基因能被設成暫停
* 「百萬像素」DNA 複製技術提供更快、更精確的診斷
* 科學家從細菌與DNA 創造出運算基石
沒有留言:
張貼留言