PG新聞
News
多年以后,人們回憶起人工智能(AI)影響生命科學領域的歷史性一幕,恐怕很難會忽略2024年10月9日這個轟動全球科技圈的日子——瑞典皇家科學院宣布,將2024年諾貝爾化學獎授予美國華盛頓大學的戴維·貝克(David Baker),以及來自谷歌DeepMind的德米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper),以表彰他們在蛋白質(zhì)設計和蛋白質(zhì)結(jié)構(gòu)預測領域作出的貢獻。
而哈薩比斯和江珀獲獎的代表作,便是2021年發(fā)布的AI模型AlphaFold2,它破解了生物學界50年來的重大挑戰(zhàn),在高精度蛋白質(zhì)結(jié)構(gòu)預測上樹立了一座豐碑。該模型能預測超過2億種蛋白質(zhì),幾乎涵蓋了地球上所有已知的蛋白質(zhì)。這些預測結(jié)果DeepMind對外免費開放,使得全球研究人員能夠大幅提高研究效率,將研究成果廣泛應用于疫苗、制藥、生物技術(shù)等領域。
隨著生成式AI浪潮興起,AI技術(shù)進一步在生命科學和醫(yī)療健康領域掀起一場效率提升浪潮,從臨床研究、疾病診療、藥物研發(fā)到報告撰寫、文獻翻譯等各個細分環(huán)節(jié),實現(xiàn)生產(chǎn)力的躍升。作為算力芯片及平臺的提供商,英特爾正以更強的通用計算性能與兼顧AI推理加速的英特爾至強平臺,提供豐富的算力產(chǎn)品組合與解決方案,加速生命科學領域的新發(fā)現(xiàn)、藥物研發(fā)創(chuàng)新與醫(yī)療發(fā)展。
AlphaFold2為生物學界帶來了原子級別的蛋白質(zhì)三維結(jié)構(gòu)預測精度,但要讓這項突破性技術(shù)惠及更廣泛的科研機構(gòu)、高校實驗室及生物、醫(yī)藥企業(yè),需進一步降低部署應用的難度和成本。
AlphaFold2的架構(gòu)有多項創(chuàng)新PG電子網(wǎng)站設計,使整個方案從預處理到推理任務都面臨高通量的計算壓力。不同蛋白質(zhì)預測中,序列越長,張量運算規(guī)模與推理計算復雜度就越大,再結(jié)合更多序列的并行計算,所需內(nèi)存容量越高。用戶在構(gòu)建和使用AlphaFold2時,需要更快的推理來縮短預測時長。
活躍于AI for Science創(chuàng)新前沿的英特爾,已經(jīng)通過一系列軟硬件優(yōu)化舉措,為AlphaFold2提供算力支持與優(yōu)化,并為內(nèi)存“增量降耗”。其解決方案覆蓋AlphaFold2的預處理、模型推理和后處理三個階段,實現(xiàn)了端到端的性能優(yōu)化。
數(shù)據(jù)顯示,相比價格高昂的GPU平臺,英特爾的AlphaFold2優(yōu)化方案結(jié)合了CPU的易獲取性和成本優(yōu)勢,在提升推理效率的同時降低內(nèi)存消耗,既能滿足多實例、長序列場景下的高通量計算與大規(guī)模推理需求,也能憑借大內(nèi)存優(yōu)勢支持更長蛋白質(zhì)序列預測。
英特爾還為AlphaFold2提供了面向英特爾架構(gòu)優(yōu)化的PyTorch和PyTorch Just-In-Time(JIT)圖編譯技術(shù),并利用切分Attention模塊、算子融合、多實例并行等方案,提升計算效率,滿足高通量計算場景下同時處理多個蛋白質(zhì)序列的預測任務。
除了加速預測單個蛋白質(zhì)三維結(jié)構(gòu)預測,基于英特爾架構(gòu)的方案同樣面向蛋白質(zhì)復合體預測 (AlphaFold2 Multimer) 管線進行了優(yōu)化與驗證,提供更具性價比的算力支持。
目前,兼具高性價比、易獲取、廣泛生態(tài)支持等優(yōu)勢的英特爾架構(gòu)AlphaFold2解決方案已展開實踐合作,加速走進科研機構(gòu)、高校實驗室以及生物制藥企業(yè),讓更多用戶能夠搭上AlphaFold2的“快車”。
藥物研發(fā)長期面臨高成本、長周期、高風險的特點,其效率與人們的健康息息相關。根據(jù)德國英戈爾施塔特工業(yè)大學在2023年發(fā)表的一篇論文,2001-2020年期間,16家大型制藥公司的研發(fā)支出每年增長6%,每款獲批新藥的平均研發(fā)費用高達61.6億美元。
靶點發(fā)現(xiàn)是藥物發(fā)現(xiàn)早期的一個關鍵環(huán)節(jié)。而AI通過分析海量數(shù)據(jù),能夠快速識別潛在的藥物靶點和候選化合物,還能設計新的分子結(jié)構(gòu),大幅加速藥物開發(fā)進程。
國內(nèi)AI制藥龍頭企業(yè)英矽智能打造了AI靶點發(fā)現(xiàn)軟件平臺PandaOmics。該平臺通過內(nèi)置的20多種預測模型和生成生物學模型,囊括來自公開文獻、科研基金、臨床試驗的文本數(shù)據(jù),以及涵蓋遺傳學、蛋白質(zhì)組學和甲基化數(shù)據(jù)的多組學數(shù)據(jù),支持在藥物研發(fā)前期快速篩選出與特定疾病高度相關的潛在靶點和生物標志物。
英特爾的處理器不僅能夠支持傳統(tǒng)的科學計算任務,還能夠高效處理AI驅(qū)動的藥物發(fā)現(xiàn)任務。通過在其多元硬件產(chǎn)品上對基于C++開發(fā)的晶體結(jié)構(gòu)預測類應用實現(xiàn)軟硬協(xié)同優(yōu)化,英特爾進一步增強了PandaOmics平臺的計算效率,并有助于降低研發(fā)成本。
例如,在第五代英特爾至強可擴展處理器和酷睿Ultra 7處理器的算力支持下,PandaOmics平臺可以根據(jù)實際需求,靈活調(diào)用公有云SaaS服務或本地部署,加速藥物研發(fā)流程。
隨著大模型及生成式AI快速發(fā)展,AI在制藥行業(yè)的滲透率持續(xù)提升。在靈活高效的算力基座驅(qū)動下,AI藥物發(fā)現(xiàn)工具將為醫(yī)生、科研人員及藥企提供更強助力,推動研發(fā)效率提升、創(chuàng)新療法突破,加速探索更多疾病的治療路徑,最終為全球患者帶來挽救生命的希望。
基因組分析是推動醫(yī)學進步的前沿學科。研究人員及醫(yī)療行業(yè)從業(yè)者可利用基因組分析來推動新藥研發(fā)、為各種疾病探尋更奏效的診治方案。基因組分析還在全球范圍內(nèi)被廣泛應用于群體測序、作物改良和人類微生物組研究。首次完成人類完整基因組測序耗時長達13年,但如今,處理一個WGS(全基因組測序)樣本只需數(shù)小時。
英特爾通過與基因分析生態(tài)系統(tǒng)合作,持續(xù)加速基因組測序并降低成本。例如,其與科研機構(gòu)聯(lián)合開發(fā)了一個由端到端軟硬件包構(gòu)成的基因組分析參考設計,旨在優(yōu)化基因組分析解決方案的性能及簡化解決方案的大規(guī)模部署,幫助用戶減少軟硬件評估的時間與成本。
該參考設計的組件經(jīng)調(diào)優(yōu),可充分發(fā)揮英特爾架構(gòu)的優(yōu)勢。第五代英特爾至強可擴展處理器利用在內(nèi)核數(shù)量、主頻、內(nèi)存子系統(tǒng)和末級緩存方面的提升,及英特爾AVX-512指令集帶來的性能增益,既能節(jié)省功耗,又能以更低成本提供加速基因組研究所需的計算性能。
測試顯示,該研究機構(gòu)將基因組分析集群從第四代英特爾至強可擴展處理器升級到第五代英特爾至強可擴展處理器后,吞吐量提升高達61%,每節(jié)點每天處理的WGS樣本數(shù)量增加至多達3倍以上,可高達14.81個WGS樣本,從而解鎖更多可用于造福人類的基因信息。
在這個經(jīng)過驗證的參考設計中,基因組分析的單位成本僅為2.34美元,每個WGS樣本的功耗僅為0.341千瓦時,這意味著每個WGS樣本產(chǎn)生的二氧化碳排放僅為120.7克。
此外,英特爾開發(fā)的基因組內(nèi)核庫(GKL)與研究機構(gòu)的基因組分析工具包 (Genomics Analytics Toolkit, GATK) 軟件集成后,進一步優(yōu)化軟件,能更好地利用英特爾AVX-512提升計算密集型任務的性能。
英特爾參與合作開發(fā)的基因組分析解決方案在高性能基因組計算與低功耗之間取得了平衡,可降低基因組測序的單位計算成本,加速WGS樣本處理,促進解決方案的快速、便捷部署。該方案已在全球基因組研究與分析項目中得到應用。
AI使高質(zhì)量的遠程醫(yī)療服務成為可能,打破地域與經(jīng)濟的壁壘,讓偏遠地區(qū)的患者也能獲得快速診斷和治療建議。加速這一進程,離不開高性能硬件的支持。
英特爾與復旦大學附屬中山醫(yī)院、聯(lián)影醫(yī)療等生態(tài)伙伴打造的“無界”智能虛擬元診室項目,利用計算機視覺、大模型、虛擬現(xiàn)實(VR)等技術(shù),將高水平醫(yī)療資源下沉到基層,為遠程患者提供診前、診中、診后的全周期服務,不僅使數(shù)字醫(yī)生能夠遠程實時執(zhí)行真實醫(yī)生的指令,還為醫(yī)患雙方提供直觀、流暢、實時交互的交流體驗。
在元診室的虛擬現(xiàn)實空間中,千里之外的醫(yī)患可實現(xiàn) “面對面” 交流。通過醫(yī)療設備數(shù)字孿生管理平臺,在英特爾硬件的支持下,醫(yī)生可以精準指導遠程患者的檢查過程,患者也能通過三維重建的數(shù)字孿生模型,清晰直觀地了解病情和診療方案,進而優(yōu)化醫(yī)患溝通體驗。
基于英特爾計算機視覺及AI技術(shù),元診室提供打造了三維效果逼真的“數(shù)字醫(yī)生”。它由中山醫(yī)院的醫(yī)學知識訓練而成,能夠?qū)崟r跟蹤以執(zhí)行醫(yī)生指令,輔助醫(yī)生進行更全面的問診,提高效率并減少誤診、漏診的風險。
英特爾優(yōu)化的醫(yī)療領域大模型技術(shù)與知識圖譜技術(shù)以及數(shù)字醫(yī)生,能夠有效幫助基層醫(yī)生完成針對疑難病癥的相關診斷工作。遇到一些復雜病情,基層醫(yī)生亦可以利用英特爾自由視角視頻技術(shù),通過云端算法和頭部追蹤算法將三維場景以數(shù)據(jù)形式傳輸至用戶端,向中山醫(yī)院專家實時展示患者病情,實現(xiàn)超越傳統(tǒng)視頻通話的多視角視頻會診體驗。
尤其在醫(yī)療資源稀缺、醫(yī)療水平不足的地區(qū),這類推動醫(yī)療服務數(shù)字化轉(zhuǎn)型的項目具有重要意義,有助于顯著提升診療效率和充分釋放醫(yī)療資源,實現(xiàn)優(yōu)質(zhì)醫(yī)療資源共享。
在數(shù)字化浪潮的推動下,算力成為數(shù)字經(jīng)濟時代的關鍵生產(chǎn)力,深刻地改變生物科學與醫(yī)療行業(yè)。從加速藥物研發(fā)、基因組分析到虛擬診療、患者管理,AI技術(shù)正全方位地推動生命科學領域的創(chuàng)新突破和醫(yī)療體系的數(shù)字化轉(zhuǎn)型,為全球醫(yī)療健康與公共衛(wèi)生開辟新的發(fā)展路徑。
坐擁龐大的CPU市場和生態(tài)系統(tǒng),英特爾通過軟硬件協(xié)同組合,向廣大醫(yī)生及科研人員提供性能強大且經(jīng)濟高效的算力底座,以潤物細無聲的方式持續(xù)改善AI在生命科學和醫(yī)療領域的部署效率與體驗。這些融入前沿技術(shù)的愛與責任,將推動高質(zhì)量的醫(yī)療資源進步與普及,為造福大眾醫(yī)療健康創(chuàng)造深遠價值。