Nat Commun:覆蓋1560種疾??!中科大/阿里巴巴等團(tuán)隊(duì)開(kāi)發(fā)綜合性生物醫(yī)學(xué)預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估模型UKB
2025-04-30 測(cè)序中國(guó) 測(cè)序中國(guó) 發(fā)表于陜西省
中科大等團(tuán)隊(duì)提出 UKB - MDRMF 綜合框架,能預(yù)測(cè)評(píng)估 1560 種疾病健康風(fēng)險(xiǎn),介紹了其構(gòu)建流程及優(yōu)勢(shì),為醫(yī)療保健提供新方案。
近日,中國(guó)科學(xué)技術(shù)大學(xué)團(tuán)隊(duì)、阿里巴巴團(tuán)隊(duì)聯(lián)合美國(guó)北卡羅來(lái)納大學(xué)團(tuán)隊(duì),通過(guò)整合來(lái)自英國(guó)生物銀行的多模態(tài)數(shù)據(jù),提出了可預(yù)測(cè)和評(píng)估1560種疾病健康風(fēng)險(xiǎn)的綜合框架UKB-MDRMF。與單一疾病模型不同,UKB-MDRMF結(jié)合了多發(fā)病機(jī)制,具有更高的預(yù)測(cè)準(zhǔn)確性,在所有疾病類型的風(fēng)險(xiǎn)評(píng)估中都表現(xiàn)更好。研究團(tuán)隊(duì)利用UKB-MDRMF預(yù)測(cè)和評(píng)估了多種疾病,有效揭示了風(fēng)險(xiǎn)因素和疾病之間的共同和獨(dú)特聯(lián)系,為健康和多病機(jī)制提供了更廣闊的視角。
同時(shí),研究團(tuán)隊(duì)簡(jiǎn)化了從數(shù)據(jù)輸入到模型構(gòu)建的整個(gè)過(guò)程,增強(qiáng)了跨各種下游任務(wù)使用UKB-MDRMF框架的靈活性和便利性,并開(kāi)發(fā)了一個(gè)互動(dòng)平臺(tái)(https://luminite.shinyapps.io/ukb-mdrmf/)來(lái)展示UKB-MDRMF的詳細(xì)結(jié)果,允許探索疾病預(yù)測(cè)以及特定風(fēng)險(xiǎn)因素和疾病類別的合并癥。
個(gè)人的健康受生活方式、環(huán)境、遺傳學(xué)以及醫(yī)療衛(wèi)生服務(wù)等因素的影響。目前,已有多項(xiàng)研究對(duì)某特定疾病或某一類型疾病進(jìn)行了大型的生物醫(yī)學(xué)預(yù)測(cè)或評(píng)估研究,這些數(shù)據(jù)的快速積累為探索疾病機(jī)制、危險(xiǎn)因素和預(yù)后標(biāo)志物提供了大量資源,但疾病的覆蓋范圍仍然不足。通過(guò)將多維健康信息與各種疾病類型相結(jié)合,可以更準(zhǔn)確的預(yù)測(cè)和更深入分析個(gè)體的健康狀況,并理解不同疾病風(fēng)險(xiǎn)因素以及疾病之間的復(fù)雜聯(lián)系。
基于UK Biobank的數(shù)據(jù),研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)全面的標(biāo)準(zhǔn)化流程來(lái)構(gòu)建UKB-MDRMF框架,包括數(shù)據(jù)預(yù)處理、模型構(gòu)建和應(yīng)用程序。UKB-MDRMF包括基本信息、生活方式、檢測(cè)、環(huán)境因素、遺傳學(xué)和影像數(shù)據(jù),是一個(gè)用于多種疾病聯(lián)合預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估的綜合性生物醫(yī)學(xué)模型,可對(duì)1560種疾病進(jìn)行個(gè)體多疾病預(yù)測(cè)和健康風(fēng)險(xiǎn)評(píng)估。
圖:UKB-MDRMF構(gòu)建流程
1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理包括分別構(gòu)建和處理預(yù)測(cè)因子和反應(yīng)變量。研究團(tuán)隊(duì)將輸入數(shù)據(jù)分為六類,從易到難逐步進(jìn)行建模和分析,最終獲得了1106個(gè)輸入變量,其中幾種表型在預(yù)處理過(guò)程中產(chǎn)生了多個(gè)變量。同時(shí),研究團(tuán)隊(duì)還考慮了數(shù)據(jù)缺失問(wèn)題,并適當(dāng)?shù)靥幚砹巳笔е?,獲得了準(zhǔn)確和可解釋的插補(bǔ)結(jié)果。對(duì)于反應(yīng)變量,研究使用了1560個(gè)苯丙氨酸氨基轉(zhuǎn)移酶代碼來(lái)系統(tǒng)地總結(jié)疾病。
2 模型構(gòu)建
UKB-MDRMF的模型構(gòu)建關(guān)注了個(gè)體疾病預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估。對(duì)預(yù)測(cè)因子類型,研究從基本信息變量開(kāi)始,逐漸結(jié)合不同的特征類型,最終包括遺傳變量。在疾病預(yù)測(cè)任務(wù)中,研究人員評(píng)估了各種方法,包括邏輯回歸、隨機(jī)森林、XGBoost、LightGBM、FCNN。不同疾病預(yù)測(cè)模型在各數(shù)據(jù)類別中的結(jié)果顯示,F(xiàn)CNN模型表現(xiàn)最好,在增加數(shù)據(jù)后,總體中值A(chǔ)UC超過(guò)0.7。傳統(tǒng)的非參數(shù)機(jī)器學(xué)習(xí)方法在多任務(wù)學(xué)習(xí)中表現(xiàn)中等。隨著更多的特征信息用于預(yù)測(cè),所有模型的預(yù)測(cè)精度不斷提高。對(duì)于罕見(jiàn)病,CATI和FCNN的AUC較高,對(duì)于常見(jiàn)疾病,CATI、FCNN和邏輯回歸均表現(xiàn)良好。
各種類型疾病的預(yù)測(cè)準(zhǔn)確性揭示了口腔和腸道疾病具有相對(duì)較低的AUC值。相比之下,與生殖系統(tǒng)相關(guān)的疾病表現(xiàn)出明顯較高的預(yù)測(cè)準(zhǔn)確性,妊娠相關(guān)疾病的AUC超過(guò)0.95,生殖器疾病的AUC超過(guò)0.8。
圖:跨數(shù)據(jù)類別、疾病類型和流行水平的疾病預(yù)測(cè)和生存模型的比較性能。
風(fēng)險(xiǎn)評(píng)估過(guò)程同樣遵循每一類預(yù)測(cè)因子的逐步增加策略,研究使用了傳統(tǒng)的Cox比例風(fēng)險(xiǎn)模型、DeepSurv以及POPDxSurv等高級(jí)模型。在四個(gè)生存模型中,DeepSurv的表現(xiàn)優(yōu)于其他模型,其次是CATISurv。相比之下,POPDxSurv的性能相對(duì)較差,需要所有六個(gè)數(shù)據(jù)類別作為輸入才能獲得更好的預(yù)測(cè)結(jié)果。此外,CoxPH模型的準(zhǔn)確性隨著更多陽(yáng)性病例的出現(xiàn)而提高,深度學(xué)習(xí)方法在罕見(jiàn)和常見(jiàn)疾病中的表現(xiàn)一直優(yōu)于DeepSurv。
對(duì)于幾乎所有疾病類型,疾病預(yù)測(cè)和生存模型都隨著更多的數(shù)據(jù)類別而改善。在增加生活方式、檢測(cè)和影像數(shù)據(jù)變量后,模型性能顯著改善。對(duì)于疾病預(yù)測(cè)任務(wù),生活方式和影像學(xué)變量對(duì)90.5%和100%疾病類型的顯著表現(xiàn)改善有貢獻(xiàn),平均AUC分別增加2.3%和2.4%。相比之下,環(huán)境和遺傳學(xué)變量產(chǎn)生的改善較少。通過(guò)增加消化和神經(jīng)疾病的生活方式變量,模型性能實(shí)現(xiàn)了顯著改善;對(duì)于生殖疾病,僅使用基本信息就獲得了高度準(zhǔn)確的預(yù)測(cè)。
圖:采用FCNN和DeepSurv的不同疾病類型的模型性能圖。
3 模型驗(yàn)證
研究團(tuán)隊(duì)對(duì)UKB-MDRMF和幾種現(xiàn)有方法進(jìn)行了比較分析,發(fā)現(xiàn)UKB-MDRMF利用不同的數(shù)據(jù)類型,對(duì)特定疾病表現(xiàn)出優(yōu)越的預(yù)測(cè)性能。
此外,研究通過(guò)UKB-MDRMF分析危險(xiǎn)因素,評(píng)估了各種疾病的特征影響。結(jié)果顯示,基本信息對(duì)妊娠、血管和生殖器疾病最有預(yù)測(cè)性。生活方式變量對(duì)妊娠和皮質(zhì)神經(jīng)疾病有意義,而檢測(cè)變量影響生殖器疾病。環(huán)境變量影響上呼吸道疾病,影像變量影響心臟、血液和泌尿系統(tǒng)疾病,遺傳學(xué)變量對(duì)幾種疾病的影響相對(duì)一致,如心臟和眼睛疾病。同時(shí),某些變量對(duì)疾病結(jié)果有著總體積極和消極影響。例如“躁郁癥或抑郁癥”的消失降低了所有疾病的發(fā)病率。相反,腰圍、體重指數(shù)、膽固醇和尿微量白蛋白的增加會(huì)促進(jìn)各種疾病的發(fā)生。
為了突出疾病預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估模型之間重要性的相似性和差異,研究團(tuán)隊(duì)比較了表現(xiàn)最好的FCNN和DeepSurv模型的前十個(gè)變量。在預(yù)測(cè)和生存模型的重要性指標(biāo)中觀察到相似性,如影像相關(guān)、抑郁相關(guān)、脂肪相關(guān)和年齡相關(guān)變量。
最后,研究團(tuán)隊(duì)利用All of Us研究數(shù)據(jù)對(duì)UKB-MDRMF框架進(jìn)行了驗(yàn)證,強(qiáng)調(diào)了該模型的穩(wěn)健性及其在分析不同人群多病性方面的適應(yīng)性和潛力。
4 結(jié)語(yǔ)
UKB-MDRMF為利用大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)進(jìn)行分析和建模提供了高效靈活的解決方案,可聯(lián)合預(yù)測(cè)和評(píng)估數(shù)千種疾病。結(jié)果表明,UKB-MDRMF超越了單一疾病模型,有效地揭示了多種風(fēng)險(xiǎn)因素和疾病之間以及疾病本身之間的潛在聯(lián)系,并產(chǎn)生了優(yōu)越的預(yù)測(cè)性能。
UKB-MDRMF通過(guò)為多種疾病預(yù)測(cè)、風(fēng)險(xiǎn)評(píng)估和多樣化應(yīng)用提供全面的解決方案,代表了該領(lǐng)域的重大進(jìn)步,有望為醫(yī)療保健系統(tǒng)做出重大貢獻(xiàn)。多種疾病的聯(lián)合建模增強(qiáng)了表征多種疾病模式的能力,提供了對(duì)疾病如何共存的數(shù)據(jù)驅(qū)動(dòng)探索,并揭示了大規(guī)模生物醫(yī)學(xué)數(shù)據(jù)集內(nèi)疾病之間相互聯(lián)系和影響的潛在機(jī)制,為更有針對(duì)性和個(gè)性化的患者護(hù)理方法鋪平了道路。
論文原文:
Jiang, Y., Zhao, B., Wang, X. et al. UKB-MDRMF: a multi-disease risk and multimorbidity framework based on UK biobank data. Nat Commun 16, 3767 (2025). https://doi.org/10.1038/s41467-025-58724-3
版權(quán)聲明:
本網(wǎng)站所有內(nèi)容來(lái)源注明為“梅斯醫(yī)學(xué)”或“MedSci原創(chuàng)”的文字、圖片和音視頻資料,版權(quán)均屬于梅斯醫(yī)學(xué)所有。非經(jīng)授權(quán),任何媒體、網(wǎng)站或個(gè)人不得轉(zhuǎn)載,授權(quán)轉(zhuǎn)載時(shí)須注明來(lái)源為“梅斯醫(yī)學(xué)”。其它來(lái)源的文章系轉(zhuǎn)載文章,或“梅斯號(hào)”自媒體發(fā)布的文章,僅系出于傳遞更多信息之目的,本站僅負(fù)責(zé)審核內(nèi)容合規(guī),其內(nèi)容不代表本站立場(chǎng),本站不負(fù)責(zé)內(nèi)容的準(zhǔn)確性和版權(quán)。如果存在侵權(quán)、或不希望被轉(zhuǎn)載的媒體或個(gè)人可與我們聯(lián)系,我們將立即進(jìn)行刪除處理。
在此留言
相關(guān)知識(shí)
Nat Commun(IF=17.694):藥物性肝損傷的候選血清蛋白生物標(biāo)志物
蘭州理工大學(xué)冉奮教授團(tuán)隊(duì) Nat. Commun.:肝素?fù)诫s導(dǎo)電聚合物
解讀健康風(fēng)險(xiǎn)評(píng)估和疾病風(fēng)險(xiǎn)評(píng)估
Nat Med:基于73萬(wàn)人遺傳和健康數(shù)據(jù)揭示遺傳風(fēng)險(xiǎn)因素對(duì)壽命的影響
基于大數(shù)據(jù)老年多重慢性病風(fēng)險(xiǎn)預(yù)測(cè)模型構(gòu)建探究
上海交大研究團(tuán)隊(duì)合作破解腸道菌群結(jié)構(gòu)密碼,人體菌群“蹺蹺板”模型有望成為健康評(píng)估新標(biāo)準(zhǔn)
預(yù)測(cè)上百種疾病風(fēng)險(xiǎn),發(fā)現(xiàn)26個(gè)潛力新靶點(diǎn)!《細(xì)胞》:復(fù)旦團(tuán)隊(duì)繪制人類健康與疾病蛋白質(zhì)組圖譜
手臂水腫粗如“大腿”?腫瘤醫(yī)院“上肢淋巴水腫兩全管理模式”已為1.4萬(wàn)例患者提供專業(yè)評(píng)估及健康指導(dǎo)
三年內(nèi)研發(fā)動(dòng)態(tài)風(fēng)險(xiǎn)評(píng)估預(yù)測(cè)模型 為亞健康人群提供心血管病早期預(yù)警和干預(yù)
建立具有中國(guó)特色的環(huán)境與健康監(jiān)測(cè)、調(diào)查和風(fēng)險(xiǎn)評(píng)估體系
網(wǎng)址: Nat Commun:覆蓋1560種疾病!中科大/阿里巴巴等團(tuán)隊(duì)開(kāi)發(fā)綜合性生物醫(yī)學(xué)預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估模型UKB http://m.u1s5d6.cn/newsview1459354.html
推薦資訊
- 1發(fā)朋友圈對(duì)老公徹底失望的心情 12775
- 2BMI體重指數(shù)計(jì)算公式是什么 11235
- 3補(bǔ)腎吃什么 補(bǔ)腎最佳食物推薦 11199
- 4性生活姿勢(shì)有哪些 盤(pán)點(diǎn)夫妻性 10428
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計(jì)算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7828