PG新聞
News
新華社杭州7月8日電(記者 朱涵)浙江大學郭國驥教授團隊開發(fā)出一款用于基因組預(yù)測設(shè)計的深度學習AI模型“女媧CE”,能夠以超過90%的準確率預(yù)測基因組調(diào)控區(qū)域發(fā)生突變之后帶來的表型變化,并結(jié)合疾病表型設(shè)計出相應(yīng)的治療位點。8日,相關(guān)PG電子成果發(fā)表于國際學術(shù)期刊《細胞》。
據(jù)介紹,基因組由DNA組成,不僅包含蛋白質(zhì)的編碼序列,還包含大量不編碼蛋白質(zhì)的調(diào)控序列。這兩類序列的協(xié)同作用,共同決定了生物體的復(fù)雜表型特征。
“讀懂生物體的古老遺傳‘語言’,是科學家們一直致力于攀登的科學高峰?!惫鶉K說,人類基因組計劃集全球科學家之力繪制出人類基因圖譜,但多年來,科學家對其中的遺傳信息的破譯還不足10%。近年涌現(xiàn)的AI模型可幫助科學家們進一步快速、系統(tǒng)地理解隱藏在海量基因序列背后的復(fù)雜調(diào)控語言。
郭國驥團隊自主開發(fā)了超高通量、超靈敏度的單核染色質(zhì)可及性測序技術(shù),在這一技術(shù)基礎(chǔ)上構(gòu)建了覆蓋小鼠、雞、守宮、蠑螈和斑馬魚五種代表性脊椎動物的全組織調(diào)控元件圖譜,形成優(yōu)質(zhì)“數(shù)據(jù)庫”,并開發(fā)出多任務(wù)深度學習AI模型“女媧CE”,實現(xiàn)從基因組到細胞圖譜的直接預(yù)測。
“基于大量優(yōu)質(zhì)的數(shù)據(jù),‘女媧CE’模型在多項指標上超越現(xiàn)有的基因組AI模型?!惫鶉K介紹,“女媧CE”能夠預(yù)測基因組調(diào)控元件發(fā)生突變之后對各種細胞類型帶來的表型變化,經(jīng)檢測準確率超過90%。
“基于‘女媧CE’預(yù)測出的一個鐮刀型貧血癥治療性基因位點,我們對該位點進行修改,使得胎兒血紅蛋白表達量得到提升。”郭國驥表示,“女媧CE”系列模型將幫助研究人員更好地理解遺傳PG電子病發(fā)生的復(fù)雜原因,為生命科學、醫(yī)學和農(nóng)學研究提供強大的支撐。
為確保最佳瀏覽效果,建議您使用以下瀏覽器版本:IE瀏覽器9.0版本及以上;Google Chrome瀏覽器63版本及以上;360瀏覽器9.1版本及以上,且IE內(nèi)核9.0及以上。