首頁 資訊 一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統

一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統

來源:泰然健康網 時間:2024年12月20日 22:12

一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統

1.本發(fā)明屬于人工智能疾病診斷技術領域,具體涉及一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統。

背景技術:

2.人工智能是當今科技發(fā)展的代表性前沿方向,與眾多學科及產業(yè)領域相結合,對當今的科學及社會生產方式產生重大的影響,以人工智能為核心技術的智能醫(yī)學被看作是未來醫(yī)學發(fā)展的重要方向;
3.醫(yī)學影像學作為數字化醫(yī)療時代發(fā)展的代表學科,以高分辨薄層掃描、多模態(tài)成像為特點的影像設備和技術的飛躍發(fā)展,影像數據以每年30%的速度增長,占醫(yī)院數字化數據的90%,放射科從傳統膠片到全面數字化pacs閱片臨床工作方式的轉變,使得放射科醫(yī)師每天的圖像數據瀏覽工作量劇增;同時期,我國經濟社會進步、人們健康意識及需求的提高,也導致臨床放射工作量的增加;而每年醫(yī)療資源和人力投入增長遠遠不能滿足需求;
4.近年來,隨著深度學習技術在計算機視覺,自然語言處理等領域的快速發(fā)展,基于人工智能的計算機輔助診斷技術吸引了業(yè)界越來越多的關注。這些領域的快速成功發(fā)展,為患者提供更高效、更經濟的醫(yī)療保健帶來了希望。在眾多的影像學檢查中,x射線相對于ct、mri等影像學檢查,在中國應用更廣泛,即便鄉(xiāng)鎮(zhèn)一級的衛(wèi)生院都能獨立開展x射線檢查。因此,根據x光片自動準確地判別疾病類型有廣闊的應用前景,ai醫(yī)學影像為解決當前的醫(yī)療困境提供了具有廣闊應用前景的技術,順應學科及社會發(fā)展的時代要求,對我國智慧醫(yī)療的發(fā)展有巨大的推進作用。但是,如何構建出流通性、通用型、魯棒性的醫(yī)學影像人工智能診斷模型仍然是待需解決的問題。

技術實現要素:

5.為了解決上述技術問題,本發(fā)明提供了一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統,所構建的系統模型可解決目前醫(yī)學影像完全由人工憑經驗診斷的局面,由人工智能代替,實現診斷結果的真實準確性、穩(wěn)定性;同時構建的診斷模型具有通用性和魯棒性。
6.為了達到上述技術目的,本發(fā)明是通過以下技術方案實現的:一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統,其特征在于,包括以下部分:數據采集模塊、數據預處理模塊、模型建立模塊、模型驗證模塊;
7.所述數據采集模塊用于采集來自不同數據源的x射線影像數據,如x光機生成的dicom原始數據,開源的jpg、png格式網絡圖片;對上述數據的真實性、完整性、圖像清晰度質量進行預處理和評估后進行備用;
8.所述數據預處理模塊接收來自數據采集模塊的數據,并逐一對影像數據信息中包含的隱私敏感信息進行脫敏處理;對脫敏后的數據進行降噪、數據強化、去除離群點以及無關數據和歸一化處理;將數據集切分為訓練集和驗證集,并對數據進行學習標簽標注;
9.所述模型建立模塊將將訓練集和驗證集樣本導入包括神經網絡深度的學習器經過模型初始化、訓練配置、訓練過程、保存模型訓練步驟在驗證集上獲得的最優(yōu)的診斷模型參數;
10.所述模型驗證模塊通過k-fold cross validation交叉驗證法對構建模型在實際數據應用中的準確度;上述的訓練集樣本用于訓練模型,驗證集樣本用于驗證訓練出來的模型是否有效;為了保證交叉驗證結果的穩(wěn)定性,對一個樣本數據集需要多次不同的劃分,得到不同的互補子集,進行多次交叉驗證;取多次驗證的平均值作為驗證結果;
11.優(yōu)選的,所述影像數據采集時應首先規(guī)劃人工智能模型對數據參數及質量的要求;覆蓋不同廠家、參數、圖像質量及疾病種類;
12.優(yōu)選的,所述學習標簽標注直接面向需學習的目標問題,標注任務中使用“金標準”標簽,如病理、基因型、生存期;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;
13.優(yōu)選的,所述脫敏處理由數據預處理模塊中的隱私信息提取子模塊和去除子模塊完成,其中隱私信息提取子模塊負責提取影像數據中的患者姓名、身份信息、醫(yī)院信息;提取完成后由去除子模塊將上述隱私信息去除;
14.優(yōu)選的,所述數據預處理模塊采用wnnm算法的去噪子模塊、采用三階樣條插值的重采樣子模塊、采用基于所有圖像前景體素值的均值和標準差進行z-score標準化的標準化子模塊以及采用高斯模糊、對比度增強及伽瑪校正的數據增強子模塊;
15.優(yōu)選的,所述k-fold cross validation交叉驗證法是將原始數據分成k組,每一組子集數據分別做一次上述的驗證集樣本,其余k-1組子集數據作為訓練集樣本,得到k個模型,用這k個模型最終的驗證集的分類準確率的平均數作為此k-cv下分類器的性能指標;k一般大于等于2,實際操作時一般從3開始取,只有在原始數據集合數據量小的時候才會嘗試取2;而k-cv的實驗共需要建立k個models,并計算k次test sets的平均辨識率。
16.本發(fā)明的有益效果是:
17.本發(fā)明提供的一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統,影像數據采集時應首先規(guī)劃人工智能模型對數據參數及質量的要求;覆蓋不同廠家、參數、圖像質量及疾病種類;學習標簽標注直接面向需學習的目標問題,標注任務中使用“金標準”標簽,如病理、基因型、生存期等;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;嚴格控制數據集的質量,提高數據集的標注準確性可有效提高模型的準確性和魯棒性;使建立的診斷模型具有較高的通用性,可針對多種疾病的人工智能輔助診斷。
附圖說明
18.圖1是本發(fā)明的模型構建結構示意圖。
具體實施方式
19.為了對本發(fā)明的方案及效果做出清楚、完整的描述,通過以下實施例進行詳細說明;
20.實施例1
21.一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統,其特征在于,包括以下部
分:數據采集模塊、數據預處理模塊、模型建立模塊、模型驗證模塊;
22.所述數據采集模塊用于采集來自不同數據格式的x光片數據;對上述數據的真實性、完整性、圖像清晰度質量進行評估后進行備用;
23.所述數據預處理模塊接收來自數據采集模塊的數據,并逐一對影像數據信息中包含的隱私敏感信息進行脫敏處理;對脫敏后的數據進行降噪、數據強化、去除離群點以及無關數據和歸一化處理;將數據切分為訓練集和驗證集;并對數據進行學習標簽標注;
24.所述模型建立模塊將預處理后的數據分為訓練集樣本和驗證集樣本;將訓練集樣本和驗證集樣本導入包括神經網絡深度學習的學習器經過模型設計、訓練配置、訓練過程、保存模型訓練步驟在驗證集上獲得的最優(yōu)的診斷模型參數;
25.所述模型驗證模塊通過k-fold cross validation交叉驗證法對構建模型在實際數據應用中的準確度;上述的訓練集樣本用于訓練模型,驗證集樣本用于驗證訓練出來的模型是否有效;為了保證交叉驗證結果的穩(wěn)定性,對一個樣本數據集需要多次不同的劃分,得到不同的互補子集,進行多次交叉驗證;取多次驗證的平均值作為驗證結果;
26.優(yōu)選的,所述影像數據采集時應首先規(guī)劃人工智能模型對數據參數及質量的要求;覆蓋不同廠家、參數、圖像質量及疾病種類;
27.優(yōu)選的,所述學習標簽標注直接面向需學習的目標問題,標注任務中使用“金標準”標簽,如病理、基因型、生存期等;其次采用影像科量化知識,如病變位置、范圍、良惡性評分;
28.優(yōu)選的,所述脫敏處理由數據預處理模塊中的隱私信息提取子模塊和去除子模塊完成,其中隱私信息提取子模塊負責提取影像數據中的患者姓名、身份信息、醫(yī)院信息;提取完成后由去除子模塊將上述隱私信息去除;
29.優(yōu)選的,所述數據預處理模塊采用wnnm算法的去噪子模塊、采用三階樣條插值的重采樣子模塊、采用基于所有圖像前景體素值的均值和標準差進行z-score標準化的標準化子模塊以及采用高斯模糊、對比度增強及伽瑪校正的數據增強子模塊;
30.降噪的圖像塊為pi,由該圖像塊以及圖像上與其相似的圖像塊組成的矩陣為yi,對應的降噪后的矩陣為xi,低秩矩陣最小化可以用來求矩陣的解,于是我們得到目標函數:
[0031][0032]
其中,為噪聲方差,用于歸一化f范數,而其中ω=[(ω1,...,ωn]中的每一項都為非負數,對應每一個奇異值,如下:
[0033][0034]
其中,σi(x)為x的第i奇異值,可以觀察到,當奇異值越大時權重越小,kw為相似圖像patch的數量,ε為防止被零正常的小參數;假設在初始時刻,噪聲能量是在各個特征上分布是均勻的,因此初始化σi(x)為:
[0035][0036]
最后同樣對yi進行奇異值分解為yj=u∑v,然后目標函數的解為:
[0037]
xi=usw(∑)v
[0038]
優(yōu)選的,所述k-fold cross validation交叉驗證法是將原始數據分成k組,每一組子集數據分別做一次上述的驗證集樣本,其余k-1組子集數據作為訓練集樣本,得到k個模型,用這k個模型最終的驗證集的分類準確率的平均數作為此k-cv下分類器的性能指標;k一般大于等于2,實際操作時一般從3開始取,只有在原始數據集合數據量小的時候才會嘗試取2;而k-cv的實驗共需要建立k個models,并計算k次test sets的平均辨識率;
[0039]
1)將全部訓練集t分成k個不相交的子集,假設t中的訓練樣例個數為m,那么每一個子集有m/k個訓練樣例,相應的子集稱作{t1,t2,....tk};
[0040]
2)每次從模型集合m中拿出來一個mi,然后在訓練子集中選擇出k-1個{t1,t2,tj-1,tj+1..,tk}(也就是每次只留下一個tj),使用這k-1個子集訓練mi后,得到假設函數fij;最后使用剩下的一份tj作測試,得到預測誤差eij;
[0041]
3)由于每次留下一個tj(j從1到k),因此會得到k個預測誤差,那么對于一個mi,它的預測誤差是這k個預測誤差的平均;
[0042]
4)選出平均經驗錯誤率最小的mi,然后使用全部的t再做一次訓練,得到最后的模型fi。

相關知識

衛(wèi)健委、國務院、中華醫(yī)學會新發(fā)文未來五年人工智能輔助醫(yī)學影像
人工智能也可“望聞問切” 輔助中醫(yī)診療更便捷
循證醫(yī)學知識庫的智能預問診系統探究
人工智能(AI)對智慧醫(yī)療的影響及其未來研發(fā)方向
人工智能進軍醫(yī)療領域,智能診斷系統引領健康管理新趨勢
智能問診大模型的構筑:編織健康智慧的經緯
從AI醫(yī)學影像出發(fā),華為攜手“懂行”伙伴共筑醫(yī)療智能體
人工智能大模型在醫(yī)療健康領域的深度應用
AI如何走入臨床?百度健康:AI未來能輔助醫(yī)生做診斷診療
智慧醫(yī)療人工智能的應用.ppt

網址: 一種面向醫(yī)學影像的人工智能輔助診斷模型構建系統 http://m.u1s5d6.cn/newsview682979.html

推薦資訊