2008-03-13

尋找網路的演算法 -- 用於基因或網際網路

Algorithm finds the network -- for genes or the Internet
http://www.physorg.com/news124554531.html

March 12, 2008

人類疾病與社交網路看來鮮有相同之處。然而這兩者的關鍵都位於「網路」、網路內的通訊,甚至,更進一步,社群的次結構(substructures)。在最近一篇 Physical Review E 77:016104 (2008) 的文章中,Weixiong Zhang 博士(音譯:章偉雄),華盛頓大學電腦科學與工程副教授與遺傳學副教授,以及他的博士生,Jianhua Ruan 發表了一套演算法,能自動識別社群以及他們在不同網路中微妙的結構。

許多複雜系統能以網路作為代表,Zhang 說,包括他所研究的遺傳網路、社交網路以及網際網路本身。網路的社群結構具有自然分割(division)的特徵,在其中每個次網路的頂點(vertex)彼此高度相關,雖然與其他網路的連結較不強烈。

社群在結構上相對來說彼此較為獨立,但研究者認為每個社群會相應到一個基礎的功能單元。在一個遺傳網路中的社群通常包含具有類似功能的基因,正如同全球資訊網上的某個社群一樣,通常與網頁上相似的話題一致。

Zhang 與 Ruan 全部所需的只有資料。他們的演算法較其他現存類似演算法更具縮放性(scalable),而且能在細微尺度下偵測社群,且具有更高的精確性。擁有這種計算生物學工具的衝擊之一,可在基因組領域中發現。利用這種工具,研究者更能識別與了解基因的社群及其網路,以及它們如何在引發疾病中合作,例如敗血症、病毒感染、癌症與阿茲海默症。


多功能的數學工具

Zhang 與 Ruan 的演算法如此多才多藝,以致於它能夠被應用在確認涉及細菌性敗血症之共同表現基因(co-expressed genes)網路的社群結構。

"這套工具不只是用在生物學研究,也能夠用在社會學研究," Zhang 說。"它能夠決定,例如,人們如何在社交往路中互動,科學家如何在科學研究中合作。"

在生物學系統中,有許多社群具有許多蛋白質涉入,以形成複合體。"我們能用這種工具來識別內嵌在資料中的結構," Zhang 說。"舉例來說,我們已經從雜亂的資料中確認三種不同 RNA 聚合酶複合體,那對於基因轉錄至為關鍵。"

Zhang 以人工智慧專家開始其電腦科學生涯,不過最近幾年,他在計算生物學上著墨更多。他的目標是使用計算手法來解決某些基本的生物學問題,以及那些與人類疾病有關的。例如,他的小組研究 microRNAs 轉錄機制的基本問題。microRNA 是種小型、無編碼的 RNAs,那管控近乎所有已研究過的、真核生物物種的生長與壓力反應。利用機器學習技術,Zhang 及其同事證明,在四種模型物種:人類、老鼠、稻米與芥菜植物(阿拉伯芥,Arabidopsis (thaliana))中,幾乎所有基因間的(intergenic)microRNA 基因,可由 RNA 聚合酶 II 所轉錄,這種酵素能夠轉錄具蛋白質編碼的基因。其研究結果發表於 PLoS Computational Biology, 3(3):e37 (2007)。

多學科的研究,那結合運算方法與生物學資料,是 Zhang 小組中的正字標記。如同其他例子,在一篇發表於 Genome Biology, 7(6):R49 (2006) 的論文中,Zhang 及其博士生 Guandong Wang 開發一種演算法,稱為 WordSpy,那能夠從大量的基因組序列中識別出同側調控元素(cis-regulatory elements) -- 短 DNA 序列,那對於管理基因表現至關緊要。


來自於古希臘人的隱匿

WordSpy 的靈感來自於一種古代資訊隱藏技術,稱為 stegography(隱寫術),那可追溯至古希臘。就其本身而論,他們的方法不只能用在基因組序列,也能用在自然語言中。事實上,他們的方法已經延伸到分割中文當中的單字與片語。

除了研究網路之外,Zhang 也在整個 WUSTL 校園與其他大學形成一個廣泛的共同研究網路。他所研究的問題相當多變,從植物的壓力反應與病毒感染,例如稻米,到人類疾病,包括阿茲海默症、皰疹病毒感染,敗血症與心臟肥大、肺癌與肺臟移植。其小組所開發的計算工具協助他與他的研究夥伴解決基因表現的擾動(perturbation)能導致複雜的特性與人類的疾病,還有 microRNAs 如何管控基因表現。

Zhang 最近獲得來自於 Alzheimer's Association(阿茲海默症協會)的補助金,用來開發計算系統生物學方法,以分析患病腦部中的基因表現擾動。他已經與華盛頓大學醫學系與加州 Scripps Institute 的科學家共同合作,研究約 30 個死後腦部樣本,那些人都死於阿茲海默症。

"我對於將害病腦中基因表現的擾動給模型化以及尋找遺傳特徵相當有興趣," Zhang 說。"因為阿茲海默症的複雜性,我們正開發其他工具。那是種多基因(polygenic)疾病,有很多基因起作用。我確信我們將發現有個網路涉入其中。"

※ 相關報導:

* Identifying network communities with a high resolution
http://link.aps.org/abstract/PRE/v77/e016104
Jianhua Ruan and Weixiong Zhang
Phys. Rev. E 77, 016104 (2008)
doi: 10.1103/PhysRevE.77.016104
* Characterization and Identification of MicroRNA Core Promoters in Four Model Species
http://www.ploscompbiol.org/article/info:doi/10.1371/journal.pcbi.0030037
Xuefeng Zhou, Jianhua Ruan, Guandong Wang, Weixiong Zhang
PLoS Comput Biol 3(3): e37.
doi:10.1371/journal.pcbi.0030037
* A steganalysis-based approach to comprehensive identification and characterization of functional regulatory elements
http://genomebiology.com/2006/7/6/R49/abstract
Guandong Wang and Weixiong Zhang
Genome Biology 2006, 7:R49
doi: 10.1186/gb-2006-7-6-r49
連結 - 讓60億人串在一起的無形網路
強大的新網路技術讓基因探索更容易
研究者揭露人類--病原體蛋白質的互動網路
中研院發現DNA關鍵序列 可望開發抗癌藥物
研究者描繪染色體功能的新管控者
思考太複雜?神經活動遠比所認為的可預測

一國的「產品空間」決定經濟成長
研究者完成 25 年來首度「網際網路普查」
等公車或走路 數學家:懶是上策
新演算法從 2D 照片重建 3D 景致
科學家對整個城市進行藥物檢測

沒有留言: