科技日?qǐng)?bào)記者 張夢(mèng)然
美國(guó)西北大學(xué)團(tuán)隊(duì)開發(fā)出一種計(jì)算工具,能夠從有限的基因表達(dá)數(shù)據(jù)中提取關(guān)鍵信息,識(shí)別出多種復(fù)雜疾病背后的多基因組合。這項(xiàng)技術(shù)基于生成式人工智能(AI),為未來的精準(zhǔn)醫(yī)學(xué)和藥物開發(fā)提供了強(qiáng)有力工具。研究論文發(fā)表在最新的《美國(guó)國(guó)家科學(xué)院院刊》上。
許多疾病是由多種基因共同作用決定的,而不是僅僅一個(gè)“壞”基因造成。這種復(fù)雜的基因網(wǎng)絡(luò)使得科學(xué)家難以準(zhǔn)確識(shí)別哪些基因組合會(huì)導(dǎo)致疾病的發(fā)生。為了應(yīng)對(duì)這一挑戰(zhàn),團(tuán)隊(duì)開發(fā)了名為TWAVE的新模型。
該模型利用生成式AI技術(shù),模擬健康和患病狀態(tài)下的基因表達(dá)情況,從而將基因活動(dòng)的變化與表型變化相對(duì)應(yīng)。它不僅識(shí)別參與疾病發(fā)展的基因群,還使用優(yōu)化算法精確定位最可能引發(fā)細(xì)胞狀態(tài)轉(zhuǎn)變的關(guān)鍵基因變化。
目前,廣泛使用的全基因組關(guān)聯(lián)研究(GWAS)主要尋找與特定性狀相關(guān)的單個(gè)基因,但它們?nèi)狈y(tǒng)計(jì)能力來檢測(cè)多個(gè)基因之間的協(xié)同效應(yīng)。TWAVE不依賴于基因序列本身,而是聚焦于基因表達(dá)水平。團(tuán)隊(duì)使用臨床試驗(yàn)數(shù)據(jù)訓(xùn)練模型,使其能識(shí)別代表健康或患病狀態(tài)的表達(dá)譜。對(duì)于部分基因,他們還結(jié)合實(shí)驗(yàn)數(shù)據(jù),觀察這些基因開啟或關(guān)閉時(shí)對(duì)整個(gè)網(wǎng)絡(luò)的影響,從而更準(zhǔn)確地找到與疾病相關(guān)聯(lián)的基因網(wǎng)絡(luò)。
這種方法具有多重優(yōu)勢(shì)。它繞過了基因序列帶來的隱私問題,而且,基因表達(dá)天然包含了環(huán)境因素的影響,模型能間接反映外部因素的作用。
為了驗(yàn)證TWAVE的實(shí)際應(yīng)用效果,團(tuán)隊(duì)在幾種復(fù)雜疾病中進(jìn)行了測(cè)試。結(jié)果表明,該方法不僅能成功識(shí)別已知致病基因,還能發(fā)現(xiàn)一些被現(xiàn)有方法忽略的新基因。更重要的是,它揭示出同一種疾病可能在不同人群中由不同的基因組合引起。這一發(fā)現(xiàn)為未來實(shí)現(xiàn)根據(jù)患者個(gè)體的遺傳驅(qū)動(dòng)機(jī)制進(jìn)行個(gè)性化治療提供了理論依據(jù)。
總編輯圈點(diǎn)
在生命科學(xué)領(lǐng)域,人工智能正在成為破譯復(fù)雜疾病背后基因組合密碼的重要利器。利用傳統(tǒng)方法,科學(xué)家難以破解多基因協(xié)同的致病機(jī)制。而人工智能技術(shù)的優(yōu)點(diǎn)在于,它擅長(zhǎng)通過分析海量的基因組數(shù)據(jù)和臨床數(shù)據(jù),挖掘出多基因組合與疾病之間的隱藏關(guān)聯(lián)。此類科研進(jìn)展不僅加深了人類對(duì)疾病本質(zhì)的理解,更為疾病的早期診斷、個(gè)性化治療提供了有力支撐。這意味著,人工智能正在驅(qū)動(dòng)精準(zhǔn)醫(yī)學(xué)時(shí)代加速到來。