巨量資料分析方法真的能克服癌癥基因組嗎?

2013-08-16 09:41 來源:互聯(lián)網 作者:洛小辰

在日前一場由美國加州大學柏克萊分校舉辦的年度大會上,研究人員們展示其于加速癌癥基因療法以及擴展電腦理論領域的研究方面所取得的進步。加州大學柏克萊分校電腦科學系教授David A.Patterson呼吁,業(yè)界應共同利用百萬個基因庫以推動癌癥治療的工作。目前彼此獨立的基因庫擁有不到1萬件基因資訊,其中有許多還只是基因的部份片段。

“目前可說是藉由電腦科學來建立快速且精確的基因管線,并促進個人化治療的大好時機,我希望能盡快利用這個來幫助我和我的家庭,”Patterson并透露,目前研究人員們經常在完成實驗后刪除基因資料。

電腦科學家David Patterson期望透過巨量資料分析方法克服癌癥基因組的問題。

Patterson協(xié)助開發(fā)了一款名為SNAP的工具,這款工具明顯提供了更快且更精確地基因分析,目前也已被癌癥研究人員所廣泛使用。不過,仍然需要基準工具來改善在目前這一領域中所使用仍然具有高度主觀性的方法,他指出。

另外,加州大學準備花費6,000萬美元成立一所新的學院,期望未來的十年內能在電腦科學上實現(xiàn)新的突破?!拔覀兿胍_發(fā)出一種新的運算理論,它將遠遠超出目前的研究范疇,并涵蓋其它領域中的問題,”指導這項工作的Richard Karp表示。

“許多現(xiàn)象可被視為具有運算特性的,”他指出,”如果仔細觀察活細胞的作業(yè)方式,我們可以把它想像為一種資訊處理;而經濟也是一種資訊處理的活動。”

該校還將在今年5月舉辦一場學術研討會,以聚集各界的專家共同研究新理論的可能性。

利用巨量資料治療癌癥

Patterson的目標在于利用柏克萊分校正開發(fā)中的巨量資料工具,使其得以導入分析癌癥研究的大量基因資料。

這些工具套件包含Spark——一種用于電腦叢集的程式語言,可提供類似谷歌(Google)搜尋引擎使用的Map Reduce功能。柏克萊分析資料分析系統(tǒng)(Data Analytics System)就是一種基于Spark的開放源碼引擎。

柏克萊實驗室(Berkeley Lab)的科學家們已經利用演算法和運算管線,詳細整理出大量的影像組合,并找出腫瘤的次型態(tài)。它還可分析出異質性或腫瘤在不同程度時所包含的組織結構。接著,該運算管線可使用臨床資料進行細胞特征排序,以預測病患的預后。同時,它還使用了大規(guī)模的基因組資料,透過巨量資料分析以確定每一種次型態(tài)的分子相關性。

8

研究人員們開發(fā)出可自動分析大量腫瘤影像的方法,有助于預測癌癥治療的反應。箭頭處放大該腫瘤影像中明顯不同的區(qū)域。

目前,巨量資料研究的挑戰(zhàn)在于開發(fā)出一種技術,能夠針對巨量資料問題取得及時且具成本效益的答案。柏克萊分校的研究團隊正透過幾項行動來解決這一挑戰(zhàn):開發(fā)基于統(tǒng)計機器學習的演算法;利用云端中的多臺機器;以及發(fā)展集資技術,結合群眾之力協(xié)助回答對于其演算法與機器來說太困難的問題。

透過這些技術將有助于突破對于癌癥的治療。為了實現(xiàn)更快且更具成本效率地處理基因組資料,目前需要的是一個能夠同時使用云端機器的全新基礎架構。而當有關癌癥基因的發(fā)現(xiàn)與診斷問題超越這些演算法與機器時,還需要集合眾人的資源與智慧共同克服挑戰(zhàn)。

成像設備 基因醫(yī)療 成像

相關閱讀

暫無數(shù)據

一周熱門