一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng)
1.本發(fā)明屬于人工智能疾病診斷技術(shù)領(lǐng)域,具體涉及一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng)。
背景技術(shù):
2.人工智能是當(dāng)今科技發(fā)展的代表性前沿方向,與眾多學(xué)科及產(chǎn)業(yè)領(lǐng)域相結(jié)合,對當(dāng)今的科學(xué)及社會生產(chǎn)方式產(chǎn)生重大的影響,以人工智能為核心技術(shù)的智能醫(yī)學(xué)被看作是未來醫(yī)學(xué)發(fā)展的重要方向;
3.醫(yī)學(xué)影像學(xué)作為數(shù)字化醫(yī)療時代發(fā)展的代表學(xué)科,以高分辨薄層掃描、多模態(tài)成像為特點的影像設(shè)備和技術(shù)的飛躍發(fā)展,影像數(shù)據(jù)以每年30%的速度增長,占醫(yī)院數(shù)字化數(shù)據(jù)的90%,放射科從傳統(tǒng)膠片到全面數(shù)字化pacs閱片臨床工作方式的轉(zhuǎn)變,使得放射科醫(yī)師每天的圖像數(shù)據(jù)瀏覽工作量劇增;同時期,我國經(jīng)濟(jì)社會進(jìn)步、人們健康意識及需求的提高,也導(dǎo)致臨床放射工作量的增加;而每年醫(yī)療資源和人力投入增長遠(yuǎn)遠(yuǎn)不能滿足需求;
4.近年來,隨著深度學(xué)習(xí)技術(shù)在計算機(jī)視覺,自然語言處理等領(lǐng)域的快速發(fā)展,基于人工智能的計算機(jī)輔助診斷技術(shù)吸引了業(yè)界越來越多的關(guān)注。這些領(lǐng)域的快速成功發(fā)展,為患者提供更高效、更經(jīng)濟(jì)的醫(yī)療保健帶來了希望。在眾多的影像學(xué)檢查中,x射線相對于ct、mri等影像學(xué)檢查,在中國應(yīng)用更廣泛,即便鄉(xiāng)鎮(zhèn)一級的衛(wèi)生院都能獨立開展x射線檢查。因此,根據(jù)x光片自動準(zhǔn)確地判別疾病類型有廣闊的應(yīng)用前景,ai醫(yī)學(xué)影像為解決當(dāng)前的醫(yī)療困境提供了具有廣闊應(yīng)用前景的技術(shù),順應(yīng)學(xué)科及社會發(fā)展的時代要求,對我國智慧醫(yī)療的發(fā)展有巨大的推進(jìn)作用。但是,如何構(gòu)建出流通性、通用型、魯棒性的醫(yī)學(xué)影像人工智能診斷模型仍然是待需解決的問題。
技術(shù)實現(xiàn)要素:
5.為了解決上述技術(shù)問題,本發(fā)明提供了一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng),所構(gòu)建的系統(tǒng)模型可解決目前醫(yī)學(xué)影像完全由人工憑經(jīng)驗診斷的局面,由人工智能代替,實現(xiàn)診斷結(jié)果的真實準(zhǔn)確性、穩(wěn)定性;同時構(gòu)建的診斷模型具有通用性和魯棒性。
6.為了達(dá)到上述技術(shù)目的,本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng),其特征在于,包括以下部分:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、模型建立模塊、模型驗證模塊;
7.所述數(shù)據(jù)采集模塊用于采集來自不同數(shù)據(jù)源的x射線影像數(shù)據(jù),如x光機(jī)生成的dicom原始數(shù)據(jù),開源的jpg、png格式網(wǎng)絡(luò)圖片;對上述數(shù)據(jù)的真實性、完整性、圖像清晰度質(zhì)量進(jìn)行預(yù)處理和評估后進(jìn)行備用;
8.所述數(shù)據(jù)預(yù)處理模塊接收來自數(shù)據(jù)采集模塊的數(shù)據(jù),并逐一對影像數(shù)據(jù)信息中包含的隱私敏感信息進(jìn)行脫敏處理;對脫敏后的數(shù)據(jù)進(jìn)行降噪、數(shù)據(jù)強(qiáng)化、去除離群點以及無關(guān)數(shù)據(jù)和歸一化處理;將數(shù)據(jù)集切分為訓(xùn)練集和驗證集,并對數(shù)據(jù)進(jìn)行學(xué)習(xí)標(biāo)簽標(biāo)注;
9.所述模型建立模塊將將訓(xùn)練集和驗證集樣本導(dǎo)入包括神經(jīng)網(wǎng)絡(luò)深度的學(xué)習(xí)器經(jīng)過模型初始化、訓(xùn)練配置、訓(xùn)練過程、保存模型訓(xùn)練步驟在驗證集上獲得的最優(yōu)的診斷模型參數(shù);
10.所述模型驗證模塊通過k-fold cross validation交叉驗證法對構(gòu)建模型在實際數(shù)據(jù)應(yīng)用中的準(zhǔn)確度;上述的訓(xùn)練集樣本用于訓(xùn)練模型,驗證集樣本用于驗證訓(xùn)練出來的模型是否有效;為了保證交叉驗證結(jié)果的穩(wěn)定性,對一個樣本數(shù)據(jù)集需要多次不同的劃分,得到不同的互補子集,進(jìn)行多次交叉驗證;取多次驗證的平均值作為驗證結(jié)果;
11.優(yōu)選的,所述影像數(shù)據(jù)采集時應(yīng)首先規(guī)劃人工智能模型對數(shù)據(jù)參數(shù)及質(zhì)量的要求;覆蓋不同廠家、參數(shù)、圖像質(zhì)量及疾病種類;
12.優(yōu)選的,所述學(xué)習(xí)標(biāo)簽標(biāo)注直接面向需學(xué)習(xí)的目標(biāo)問題,標(biāo)注任務(wù)中使用“金標(biāo)準(zhǔn)”標(biāo)簽,如病理、基因型、生存期;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;
13.優(yōu)選的,所述脫敏處理由數(shù)據(jù)預(yù)處理模塊中的隱私信息提取子模塊和去除子模塊完成,其中隱私信息提取子模塊負(fù)責(zé)提取影像數(shù)據(jù)中的患者姓名、身份信息、醫(yī)院信息;提取完成后由去除子模塊將上述隱私信息去除;
14.優(yōu)選的,所述數(shù)據(jù)預(yù)處理模塊采用wnnm算法的去噪子模塊、采用三階樣條插值的重采樣子模塊、采用基于所有圖像前景體素值的均值和標(biāo)準(zhǔn)差進(jìn)行z-score標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化子模塊以及采用高斯模糊、對比度增強(qiáng)及伽瑪校正的數(shù)據(jù)增強(qiáng)子模塊;
15.優(yōu)選的,所述k-fold cross validation交叉驗證法是將原始數(shù)據(jù)分成k組,每一組子集數(shù)據(jù)分別做一次上述的驗證集樣本,其余k-1組子集數(shù)據(jù)作為訓(xùn)練集樣本,得到k個模型,用這k個模型最終的驗證集的分類準(zhǔn)確率的平均數(shù)作為此k-cv下分類器的性能指標(biāo);k一般大于等于2,實際操作時一般從3開始取,只有在原始數(shù)據(jù)集合數(shù)據(jù)量小的時候才會嘗試取2;而k-cv的實驗共需要建立k個models,并計算k次test sets的平均辨識率。
16.本發(fā)明的有益效果是:
17.本發(fā)明提供的一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng),影像數(shù)據(jù)采集時應(yīng)首先規(guī)劃人工智能模型對數(shù)據(jù)參數(shù)及質(zhì)量的要求;覆蓋不同廠家、參數(shù)、圖像質(zhì)量及疾病種類;學(xué)習(xí)標(biāo)簽標(biāo)注直接面向需學(xué)習(xí)的目標(biāo)問題,標(biāo)注任務(wù)中使用“金標(biāo)準(zhǔn)”標(biāo)簽,如病理、基因型、生存期等;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;嚴(yán)格控制數(shù)據(jù)集的質(zhì)量,提高數(shù)據(jù)集的標(biāo)注準(zhǔn)確性可有效提高模型的準(zhǔn)確性和魯棒性;使建立的診斷模型具有較高的通用性,可針對多種疾病的人工智能輔助診斷。
附圖說明
18.圖1是本發(fā)明的模型構(gòu)建結(jié)構(gòu)示意圖。
具體實施方式
19.為了對本發(fā)明的方案及效果做出清楚、完整的描述,通過以下實施例進(jìn)行詳細(xì)說明;
20.實施例1
21.一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng),其特征在于,包括以下部
分:數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、模型建立模塊、模型驗證模塊;
22.所述數(shù)據(jù)采集模塊用于采集來自不同數(shù)據(jù)格式的x光片數(shù)據(jù);對上述數(shù)據(jù)的真實性、完整性、圖像清晰度質(zhì)量進(jìn)行評估后進(jìn)行備用;
23.所述數(shù)據(jù)預(yù)處理模塊接收來自數(shù)據(jù)采集模塊的數(shù)據(jù),并逐一對影像數(shù)據(jù)信息中包含的隱私敏感信息進(jìn)行脫敏處理;對脫敏后的數(shù)據(jù)進(jìn)行降噪、數(shù)據(jù)強(qiáng)化、去除離群點以及無關(guān)數(shù)據(jù)和歸一化處理;將數(shù)據(jù)切分為訓(xùn)練集和驗證集;并對數(shù)據(jù)進(jìn)行學(xué)習(xí)標(biāo)簽標(biāo)注;
24.所述模型建立模塊將預(yù)處理后的數(shù)據(jù)分為訓(xùn)練集樣本和驗證集樣本;將訓(xùn)練集樣本和驗證集樣本導(dǎo)入包括神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的學(xué)習(xí)器經(jīng)過模型設(shè)計、訓(xùn)練配置、訓(xùn)練過程、保存模型訓(xùn)練步驟在驗證集上獲得的最優(yōu)的診斷模型參數(shù);
25.所述模型驗證模塊通過k-fold cross validation交叉驗證法對構(gòu)建模型在實際數(shù)據(jù)應(yīng)用中的準(zhǔn)確度;上述的訓(xùn)練集樣本用于訓(xùn)練模型,驗證集樣本用于驗證訓(xùn)練出來的模型是否有效;為了保證交叉驗證結(jié)果的穩(wěn)定性,對一個樣本數(shù)據(jù)集需要多次不同的劃分,得到不同的互補子集,進(jìn)行多次交叉驗證;取多次驗證的平均值作為驗證結(jié)果;
26.優(yōu)選的,所述影像數(shù)據(jù)采集時應(yīng)首先規(guī)劃人工智能模型對數(shù)據(jù)參數(shù)及質(zhì)量的要求;覆蓋不同廠家、參數(shù)、圖像質(zhì)量及疾病種類;
27.優(yōu)選的,所述學(xué)習(xí)標(biāo)簽標(biāo)注直接面向需學(xué)習(xí)的目標(biāo)問題,標(biāo)注任務(wù)中使用“金標(biāo)準(zhǔn)”標(biāo)簽,如病理、基因型、生存期等;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;
28.優(yōu)選的,所述脫敏處理由數(shù)據(jù)預(yù)處理模塊中的隱私信息提取子模塊和去除子模塊完成,其中隱私信息提取子模塊負(fù)責(zé)提取影像數(shù)據(jù)中的患者姓名、身份信息、醫(yī)院信息;提取完成后由去除子模塊將上述隱私信息去除;
29.優(yōu)選的,所述數(shù)據(jù)預(yù)處理模塊采用wnnm算法的去噪子模塊、采用三階樣條插值的重采樣子模塊、采用基于所有圖像前景體素值的均值和標(biāo)準(zhǔn)差進(jìn)行z-score標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化子模塊以及采用高斯模糊、對比度增強(qiáng)及伽瑪校正的數(shù)據(jù)增強(qiáng)子模塊;
30.降噪的圖像塊為pi,由該圖像塊以及圖像上與其相似的圖像塊組成的矩陣為yi,對應(yīng)的降噪后的矩陣為xi,低秩矩陣最小化可以用來求矩陣的解,于是我們得到目標(biāo)函數(shù):
[0031][0032]
其中,為噪聲方差,用于歸一化f范數(shù),而其中ω=[(ω1,...,ωn]中的每一項都為非負(fù)數(shù),對應(yīng)每一個奇異值,如下:
[0033][0034]
其中,σi(x)為x的第i奇異值,可以觀察到,當(dāng)奇異值越大時權(quán)重越小,kw為相似圖像patch的數(shù)量,ε為防止被零正常的小參數(shù);假設(shè)在初始時刻,噪聲能量是在各個特征上分布是均勻的,因此初始化σi(x)為:
[0035][0036]
最后同樣對yi進(jìn)行奇異值分解為yj=u∑v,然后目標(biāo)函數(shù)的解為:
[0037]
xi=usw(∑)v
[0038]
優(yōu)選的,所述k-fold cross validation交叉驗證法是將原始數(shù)據(jù)分成k組,每一組子集數(shù)據(jù)分別做一次上述的驗證集樣本,其余k-1組子集數(shù)據(jù)作為訓(xùn)練集樣本,得到k個模型,用這k個模型最終的驗證集的分類準(zhǔn)確率的平均數(shù)作為此k-cv下分類器的性能指標(biāo);k一般大于等于2,實際操作時一般從3開始取,只有在原始數(shù)據(jù)集合數(shù)據(jù)量小的時候才會嘗試取2;而k-cv的實驗共需要建立k個models,并計算k次test sets的平均辨識率;
[0039]
1)將全部訓(xùn)練集t分成k個不相交的子集,假設(shè)t中的訓(xùn)練樣例個數(shù)為m,那么每一個子集有m/k個訓(xùn)練樣例,相應(yīng)的子集稱作{t1,t2,....tk};
[0040]
2)每次從模型集合m中拿出來一個mi,然后在訓(xùn)練子集中選擇出k-1個{t1,t2,tj-1,tj+1..,tk}(也就是每次只留下一個tj),使用這k-1個子集訓(xùn)練mi后,得到假設(shè)函數(shù)fij;最后使用剩下的一份tj作測試,得到預(yù)測誤差eij;
[0041]
3)由于每次留下一個tj(j從1到k),因此會得到k個預(yù)測誤差,那么對于一個mi,它的預(yù)測誤差是這k個預(yù)測誤差的平均;
[0042]
4)選出平均經(jīng)驗錯誤率最小的mi,然后使用全部的t再做一次訓(xùn)練,得到最后的模型fi。
相關(guān)知識
衛(wèi)健委、國務(wù)院、中華醫(yī)學(xué)會新發(fā)文未來五年人工智能輔助醫(yī)學(xué)影像
人工智能也可“望聞問切” 輔助中醫(yī)診療更便捷
循證醫(yī)學(xué)知識庫的智能預(yù)問診系統(tǒng)探究
人工智能(AI)對智慧醫(yī)療的影響及其未來研發(fā)方向
人工智能進(jìn)軍醫(yī)療領(lǐng)域,智能診斷系統(tǒng)引領(lǐng)健康管理新趨勢
智能問診大模型的構(gòu)筑:編織健康智慧的經(jīng)緯
從AI醫(yī)學(xué)影像出發(fā),華為攜手“懂行”伙伴共筑醫(yī)療智能體
人工智能大模型在醫(yī)療健康領(lǐng)域的深度應(yīng)用
AI如何走入臨床?百度健康:AI未來能輔助醫(yī)生做診斷診療
智慧醫(yī)療人工智能的應(yīng)用.ppt
網(wǎng)址: 一種面向醫(yī)學(xué)影像的人工智能輔助診斷模型構(gòu)建系統(tǒng) http://m.u1s5d6.cn/newsview682979.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826