MedBench 最新榜單出爐!潤達醫(yī)療聯(lián)合華為攬獲評測雙冠
5 月 6 日,醫(yī)療大模型評測平臺 MedBench 發(fā)布新版評測榜單,潤達醫(yī)療與華為基于華為云盤古大模型創(chuàng)新研發(fā)的潤醫(yī)醫(yī)療大模型以 92.9 分在自測榜單中拔得頭籌,在專業(yè)評測榜單中以 85.2 分榮膺桂冠。潤醫(yī)醫(yī)療大模型在醫(yī)學(xué)語言理解、醫(yī)學(xué)安全和倫理等核心測評維度中表現(xiàn)突出。
最新版 MedBench 榜單(2025 年 2 月版)
MedBench 作為中文醫(yī)療大模型權(quán)威評測平臺,由上海人工智能實驗室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家機構(gòu)打造,已成為全球醫(yī)療 AI 領(lǐng)域重要參照標(biāo)準(zhǔn)之一。目前,平臺已累計評測全球 387 個醫(yī)療大模型,從醫(yī)學(xué)語言理解、生成、知識問答、復(fù)雜推理及醫(yī)療安全倫理五大維度,提供客觀科學(xué)的性能評估。
潤醫(yī)醫(yī)療大模型能夠一舉斬獲雙料第一,甚至在自測榜單中,醫(yī)學(xué)語言理解、醫(yī)療安全和倫理維度分別斬獲 122.1、103.1 高分,及在專業(yè)評測榜中,醫(yī)學(xué)語言理解維度斬獲 119.7 高分,充分佐證了潤達醫(yī)療在醫(yī)療大模型研發(fā)領(lǐng)域深厚的技術(shù)積累與強大的創(chuàng)新硬實力。此外,在醫(yī)學(xué)復(fù)雜推理等高階復(fù)雜醫(yī)療場景中,模型也取得了領(lǐng)先的效果,凸顯了模型運用醫(yī)學(xué)知識進行復(fù)雜分析和嚴(yán)謹(jǐn)推理的能力,將在醫(yī)學(xué)輔助診療、提升醫(yī)療效率和準(zhǔn)確率等方面發(fā)揮重要作用。
多維能力突出重構(gòu)人機協(xié)同范式
潤醫(yī)醫(yī)療大模型在華為云盤古大模型 L0 層的基礎(chǔ)上,訓(xùn)練使用了千億級高質(zhì)量的中英文醫(yī)學(xué)文獻、醫(yī)學(xué)指南、書籍,及千萬量級醫(yī)療健康檔案和知識圖譜等數(shù)據(jù),融合高質(zhì)量通用數(shù)據(jù),構(gòu)成了潤醫(yī)醫(yī)療大模型底座。
從技術(shù)特性來看,380 億高參數(shù)量賦予模型強大的學(xué)習(xí)能力,使其能夠精準(zhǔn)捕捉醫(yī)療數(shù)據(jù)中的復(fù)雜模式與內(nèi)在關(guān)系,顯著提升語言理解和生成能力,足以勝任各類復(fù)雜醫(yī)療任務(wù)。而支持 32k 序列長度,則確保模型具備卓越的長文本處理能力,能夠充分理解上下文語義,極大增強對復(fù)雜醫(yī)療文本的分析解讀效能,可在多輪對話、復(fù)雜病例分析等應(yīng)用場景中優(yōu)勢明顯。作為大模型訓(xùn)練的核心要素,海量高質(zhì)量數(shù)據(jù)為模型提供了豐富且準(zhǔn)確的知識來源,可有效提升模型泛化能力,使其在各類實際醫(yī)療場景中能夠做出更精準(zhǔn)的判斷與決策。
基于模型底座,潤達醫(yī)療還創(chuàng)新研發(fā)了循證推理引擎,通過構(gòu)建“動態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化”的“三位一體”臨床決策系統(tǒng)。其中,動態(tài)權(quán)重分配確保了模型可實時聚焦關(guān)鍵醫(yī)學(xué)信息;證據(jù)鏈追溯則通過知識圖譜,能夠驗證推理路徑;不確定性量化則對模糊信息進行概率評估。三項創(chuàng)新機制的協(xié)同運作,有效將模型幻覺率嚴(yán)格控制了在醫(yī)療級安全閾值內(nèi)。不僅如此,潤達醫(yī)療還打造具有雙向進化機制的可信 AI 大腦,在服務(wù)醫(yī)生的過程中持續(xù)學(xué)習(xí)臨床反饋,反向優(yōu)化自身推理路徑,重構(gòu)人機協(xié)同范式,讓 AI 成為醫(yī)生智慧的延伸,更精準(zhǔn)地滿足醫(yī)生和患者的知識需求,真正成為醫(yī)療場景中可靠的智能助手。
得益于多項核心創(chuàng)新技術(shù)的有力支撐,潤醫(yī)醫(yī)療大模型在 MedBench 評測的多個維度中均展現(xiàn)卓越性能,尤其是語言理解與醫(yī)療安全和倫理維度。在醫(yī)學(xué)語言理解上,動態(tài)權(quán)重分配、證據(jù)鏈追溯與不確定性量化機制協(xié)同,可精準(zhǔn)捕捉文本關(guān)鍵信息與邏輯。而在醫(yī)療安全與倫理維度,“循證推理 + 可信 AI”架構(gòu)深度剖析復(fù)雜場景,嚴(yán)格審查倫理風(fēng)險,為醫(yī)療質(zhì)效提升與合規(guī)安全筑牢雙重保障。
真實場景驗證賦能醫(yī)療質(zhì)效革新
從技術(shù)突破到民生福祉,潤達醫(yī)療基于大模型和數(shù)據(jù)治理的智慧醫(yī)療解決方案,貫穿“防-治-管”全流程,提供覆蓋疾病預(yù)防、診斷治療、患者管理的全生命周期服務(wù),已在智慧檢驗、病情分析、病歷生成與質(zhì)控、區(qū)域健康管理等多維度真實醫(yī)療場景中完成實踐驗證,成功實現(xiàn)智慧診療全場景落地應(yīng)用。
基于潤醫(yī)醫(yī)療大模型,潤達醫(yī)療與美年健康共同孵化的國內(nèi)首款 AI 私人健康管理師“健康小美”,截至今年 3 月底,其智能主檢應(yīng)用已在美年健康 109 家體檢中心上線應(yīng)用,且審核并生成超 39 萬份體檢報告,重點指標(biāo)精準(zhǔn)率 90%+。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。
相關(guān)知識
“京醫(yī)千詢”大模型斬獲MedBench評測榜首 京東健康領(lǐng)跑醫(yī)療健康智能化賽道
北京減肥瘦身醫(yī)院排名榜單新鮮出爐,附價格表!
長沙市瓷肌祛痘醫(yī)生排行榜單出爐
武漢腹部減肥醫(yī)院新排名前十榜單重磅出爐!
2024胡潤中國醫(yī)療青年企業(yè)家榜單 2024醫(yī)療行業(yè)杰出青年企業(yè)家名單→買購網(wǎng)
深圳抽脂醫(yī)院排名前十榜單新鮮出爐!*新排名揭曉!
北京按摩治療減肥口碑醫(yī)院排名榜新出爐!
東莞埋線減肥醫(yī)院排行榜揭曉:榜單新鮮出爐!
呼吸系統(tǒng)化藥TOP20出爐!8億感冒藥領(lǐng)跑,13個品牌大漲,吳太感康、葵花、華潤上榜
大同市臀部抽脂塑形手術(shù)醫(yī)院排名前十榜單出爐,資訊已發(fā)布
網(wǎng)址: MedBench 最新榜單出爐!潤達醫(yī)療聯(lián)合華為攬獲評測雙冠 http://m.u1s5d6.cn/newsview1218282.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎(chǔ)代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826
- 萬達信息:公司已經(jīng)有健康小屋、照護盒等產(chǎn)
- 什么是中高風(fēng)險區(qū)?居家健康監(jiān)測和自我健康
- 一圖讀懂: 居家隔離醫(yī)學(xué)觀察、居家健康
- 居家健康觀察和日常健康監(jiān)測需注意哪些?
- 新一輪疫情防控:“居家隔離醫(yī)學(xué)觀察”與“
- 居家健康監(jiān)測和居家醫(yī)學(xué)觀察有什么區(qū)別?
- 居家健康觀察、日常健康監(jiān)測該怎么做?一起
- 如何做好居家醫(yī)學(xué)觀察和健康監(jiān)測?
- 居家隔離醫(yī)學(xué)觀察=居家健康監(jiān)測?區(qū)別在這
- 新型冠狀病毒感染的肺炎公眾預(yù)防指南之六: