http://www.physorg.com/news187879201.html
March 15, 2010
猶如魔術師說:「選張牌,任何一張」般,史丹佛大學電腦科學家 Debashis Sahoo, PhD,被史丹佛幹細胞生物學與再生醫學研究所的研究者問及挑選任二個已知涉及幹細胞生長的基因時,他似乎能拿出某些訣竅。尋找這樣的基因能花上幾年時間與大筆金錢,不過 Sahoo 是位有前途的可疑幹細胞(skeptical stem cell)科學家,只要提供二個基因,他能在轉瞬間以及差不多零成本的情況下,找到涉及相同發展路徑的新基因。
Sahoo 想要證明這種驚人成就實際上能夠運作。其構想的概念驗證,那將發表在 3/15 的 PNAS 上,開啟了一種強大的、數學上的途徑來進行幹細胞研究,並展現科學中跨學科共同研究的力量。那亦證明,利用電腦來挖掘現有資料庫能澈底加速實驗室中的研究。最終,那也許促進各種醫療領域的發展,例如疾病診斷或癌症治療。
生物科學家早在他們的研究中使用數學與統計。在最簡單的例子中,當尋找涉及某種生物過程的基因時,他們會尋找具對稱相關的基因( symmetrical correlation)。例如,如果他們知道基因 A 涉及某種過程,他們會試圖測定基因 C 與基因 A 是否在相同過程中有所關聯。
四年前,當他為了電機工程博士學位與電腦科學指導教授 David Dill, PhD;共同指導教授、放射學副教授 Sylvia Plevritis PhD 進行研究時,Sahoo 上了免疫學課程,並領悟到在生物學中有許多關係並非對稱而是不對稱。Sahoo 打比方說,結果實的樹木幾乎都有葉子,不過在結果季節之外,樹木也許有或也許沒有樹葉,端看在一年中的哪個時節。
Sahoo 與 Dill 領悟到,這些不對稱關係可透過布林邏輯的應用而發現。其中,研究者建立一系列 if/then 規則,接著為那些能滿足所有規則的候選者搜尋資料。例如,科學家也許知道基因 A 在細胞生長初期非常活躍,而基因 C 則在很後面才活化。藉由篩選大型公共資料庫,Sahoo 能在許多其他細胞類型中發現,當 A 活化時,那些幾乎不曾活化的基因,以及當 C 活化時,那些幾乎總是活化的基因。研究者接著進行試驗,測定這些基因是否在生長初期與末期階段間活化。
論文中,第一作者 Sahoo 在一種稱為 B 細胞的免疫細胞中,觀察基因表現模式。從二種已知的 B 細胞基因開始,Sahoo 能在幾毫秒內搜尋整個資料庫,並發現 62 種基因相符於他所預期見到的基因模式 -- 那些在(他所開始的)二基因活化間開啟的基因。他接著檢查包含 41 種實驗室老鼠品種的資料庫,這些老鼠被改造成,在這 62 種基因中,卻少一個或以上的基因。在這 41 種品種中有 26 種在 B 細胞生長中產生缺陷。
"這是這種方法的驗證," Sahoo 表示。"生物學家對此真的很吃驚,只透過一種電腦演算法,在幾毫秒內我就能找到他們在實驗室中花好久才能分離出來的基因。" 他補充表示,他對於來自可廣泛存取之資料庫的資訊以及來自其他科學家的、已篩選過的資訊格外滿意。
Sahoo 目前正使用此技術來尋找在癌症發展中扮演某種角色的新基因。
"這證明,現有資料的計算分析能提供科學家下一步該往哪瞧的線索," 他表示。"這是某件可能對癌症有重大影響的事。那令人振奮。"
※ 相關報導:
* MiDReG: A method of mining developmentally regulated genes using Boolean implications(布林蘊含式)
http://www.pnas.org/content/early/2010/03/08/0913635107.abstract
Debashis Sahoo, Jun Seita, Deepta Bhattacharya,* 新計算技術讓基因組的比對更加容易
Matthew A. Inlay, Irving L. Weissman, Sylvia K. Plevritis, and
David L. Dilld
PNAS, Published online before print March 15, 2010,
doi: 10.1073/pnas.0913635107
* 研究者為突變發現開發全基因組定序
* 數位通訊技術協助釐清個人化治療途徑
* 在電腦內預測蛋白質結構的新方法
* 預測藥物副作用的新方法
2 則留言:
Great, It' may be a powerful tools for cancer or maybe development prcess approach, right?
ya... :)
張貼留言