美研制出新工具 可將基因序列轉(zhuǎn)譯成圖像
美國(guó)科學(xué)家開發(fā)出一個(gè)可將DNA序列轉(zhuǎn)譯成圖像的新工具,這將有助于鑒別導(dǎo)致癌癥、亨廷頓氏癥以及其他遺傳疾病的DNA圖譜的實(shí)時(shí)變化,從而使研究人員能更迅速、更有效地區(qū)分遺傳模式。
北卡羅來納州立大學(xué)計(jì)算機(jī)科學(xué)系博士生戴維·考克斯設(shè)計(jì)的這個(gè)“符號(hào)散點(diǎn)圖”工具,給DNA序列提供了一個(gè)可視化的示意圖??伎怂菇忉屨f,與現(xiàn)存的那些試圖找出重復(fù)DNA序列的計(jì)算機(jī)程序相比,人類的視覺系統(tǒng)更善于識(shí)別圖樣,并在圖樣之間進(jìn)行區(qū)分。換言之,肉眼看圖的能力目前要強(qiáng)于計(jì)算機(jī)。
確定DNA序列中的圖樣是很重要的,因?yàn)樗軒椭芯咳藛T在癌癥等疾病患者和健康人之間鑒別實(shí)時(shí)的基因變異。改進(jìn)相關(guān)DNA序列的鑒別力,將有望加快開發(fā)出各種疾病的更成功的治療方法,并允許研究人員將重點(diǎn)放在和疾病相關(guān)的部分DNA上,使人們?cè)鰪?qiáng)對(duì)這些疾病遺傳機(jī)制的了解。譬如,到底是什么打開或關(guān)閉了某個(gè)特定基因?
那么,符號(hào)散點(diǎn)圖工具是如何創(chuàng)建DNA的可視化示意圖的呢?DNA由4種核苷酸組成,分別用字母A、T、G和C表示,這些核苷酸的每三個(gè)字母串,如AAA或ATG等稱為3基體(3-mers)??伎怂菇忉屨f,有64種3基體,每個(gè)3基體用數(shù)字0至63來表示。符號(hào)散點(diǎn)圖工具將用一個(gè)很長(zhǎng)的字符串來表示DNA序列,并將其以一個(gè)個(gè)的3基體形式分開。為每個(gè)3基體畫一個(gè)點(diǎn),將數(shù)字0至63作為Y軸。X軸則代表3基體出現(xiàn)在基因序列中的順序。由此產(chǎn)生的散點(diǎn)圖就可揭示原始DNA中的有趣圖樣。將這些散點(diǎn)串在一起就能制成動(dòng)畫用來比較DNA序列。
考克斯選擇3基體的原因是其與密碼子相關(guān),密碼子是人體在蛋白質(zhì)過程中插入一個(gè)特定氨基酸所用的遺傳代碼。換句話說,他們監(jiān)督蛋白質(zhì)(人體基本構(gòu)建模塊)的產(chǎn)生。
考克斯說,盡管3基體有64個(gè),但只有20個(gè)氨基酸,所以每個(gè)氨基酸對(duì)應(yīng)3個(gè)多一點(diǎn)的3基體??伎怂乖O(shè)計(jì)的這個(gè)符號(hào)散點(diǎn)圖可使這些對(duì)應(yīng)相應(yīng)氨基酸的3基體能夠彼此相鄰。如此一來,就很容易判斷何時(shí)3基體中的一個(gè)出現(xiàn)明顯差異,即從一個(gè)氨基酸變成了另一個(gè)氨基酸。
美研制出新工具 可將基因序列轉(zhuǎn)譯成圖像