首頁(yè) 資訊 AIR科研｜AIR打造虛擬醫(yī)院，實(shí)現(xiàn)AI醫(yī)生自我進(jìn)化

AIR科研｜AIR打造虛擬醫(yī)院，實(shí)現(xiàn)AI醫(yī)生自我進(jìn)化

來(lái)源：泰然健康網(wǎng) 時(shí)間：2024年12月16日 16:10

清華大學(xué)智能產(chǎn)業(yè)研究院（AIR）與清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系合作構(gòu)建了虛擬醫(yī)院Agent Hospital，提出了醫(yī)學(xué)智能體自我進(jìn)化方法MedAgent-Zero，通過(guò)在虛擬醫(yī)院中產(chǎn)生大量無(wú)需人工標(biāo)注的數(shù)據(jù)，讓醫(yī)學(xué)智能體不斷提升醫(yī)療能力，并在真實(shí)世界數(shù)據(jù)集得到驗(yàn)證。Agent Hospital中所有的病人、護(hù)士和醫(yī)生均由大模型驅(qū)動(dòng)的自主智能體扮演，對(duì)發(fā)病、分診、掛號(hào)、問(wèn)診、檢查、診斷、開(kāi)藥、康復(fù)和隨訪的“院前-院中-院后”閉環(huán)流程進(jìn)行模擬。Agent Hospital基于知識(shí)庫(kù)與基礎(chǔ)模型對(duì)虛擬病人的疾病產(chǎn)生與發(fā)展過(guò)程進(jìn)行模擬。虛擬醫(yī)生在Agent Hospital中進(jìn)行學(xué)習(xí)（即閱讀醫(yī)學(xué)文獻(xiàn)）與實(shí)踐（即與虛擬病人交互并做診療決策），不斷從成功診療案例中總結(jié)經(jīng)驗(yàn)、從失敗案例中反思教訓(xùn)，在多個(gè)診療任務(wù)上實(shí)現(xiàn)準(zhǔn)確率持續(xù)提升。在診療近萬(wàn)名虛擬病人后（人類醫(yī)生大約需要2年時(shí)間），虛擬醫(yī)生能夠在MedQA數(shù)據(jù)集呼吸道疾病子集上超越當(dāng)前最好的方法，達(dá)到93.06%的準(zhǔn)確率。該研究由AIR馬為之助理研究員與AIR執(zhí)行院長(zhǎng)、計(jì)算機(jī)系副系主任劉洋教授擔(dān)任論文共同通訊作者，在arXiv上公開(kāi)后受到海內(nèi)外人工智能社區(qū)和醫(yī)學(xué)社區(qū)的廣泛關(guān)注和討論。

· 論文標(biāo)題：Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents · 論文鏈接： https://arxiv.org/pdf/2405.02957v1

Agent Hospital概覽

研究背景

近年來(lái)，大規(guī)模語(yǔ)言模型蓬勃發(fā)展，基于大語(yǔ)言模型的智能體技術(shù)備受關(guān)注。已有研究利用智能體技術(shù)實(shí)現(xiàn)了真實(shí)世界模擬，包括“斯坦福小鎮(zhèn)”、“狼人殺游戲”等交互和博弈場(chǎng)景；同時(shí)，智能體技術(shù)也被用在解決各類任務(wù)的調(diào)度規(guī)劃、協(xié)作過(guò)程，但這個(gè)過(guò)程大都依賴于高質(zhì)量人工標(biāo)注數(shù)據(jù)的支持。因此帶來(lái)的研究問(wèn)題是，真實(shí)環(huán)境模擬能否助力智能體的任務(wù)處理能力提升。

智慧醫(yī)療因其場(chǎng)景的重要性和應(yīng)用價(jià)值廣受關(guān)注，研究團(tuán)隊(duì)高度關(guān)注大語(yǔ)言模型和智能體技術(shù)在醫(yī)療場(chǎng)景的應(yīng)用研究。針對(duì)上述研究問(wèn)題，團(tuán)隊(duì)認(rèn)為真實(shí)的模型環(huán)境能夠助力智能體的任務(wù)能力提升和進(jìn)化，因此開(kāi)展了結(jié)合真實(shí)世界模擬和醫(yī)學(xué)能力提升的Agent Hospital研究。在本工作中，團(tuán)隊(duì)致力于構(gòu)建醫(yī)院模擬環(huán)境，探索醫(yī)學(xué)智能體在該環(huán)境下的自主進(jìn)化。目的是讓智能體能夠像人類醫(yī)生一樣在診療和學(xué)習(xí)過(guò)程中自主積累醫(yī)學(xué)知識(shí)，實(shí)現(xiàn)醫(yī)學(xué)能力的不斷進(jìn)化。

Agent Hospital構(gòu)建

研究團(tuán)隊(duì)首先致力于利用大模型智能體模擬真實(shí)世界的關(guān)鍵醫(yī)療環(huán)節(jié)。在Agent Hospital中，團(tuán)隊(duì)設(shè)計(jì)并覆蓋了從疾病產(chǎn)生到康復(fù)的8個(gè)典型場(chǎng)景，即：發(fā)病、分診、掛號(hào)、問(wèn)診、檢查、診斷、開(kāi)藥和康復(fù)，且患者會(huì)主動(dòng)參與隨訪反饋。所有的環(huán)節(jié)流程均由大模型支持，在其中的角色間能夠進(jìn)行自主交互。

主要診療環(huán)節(jié)示例

上圖展示了閉環(huán)的診療環(huán)節(jié)：當(dāng)病人智能體角色Kenneth Morgan患病后，他會(huì)前往醫(yī)院求助。分診護(hù)士Katherine Li了解Morgan的癥狀進(jìn)行分析后，將他分診到具體科室就診。Morgan會(huì)根據(jù)醫(yī)囑完成掛號(hào)、咨詢、醫(yī)學(xué)檢查后，醫(yī)生Robert會(huì)給他最終的診斷和治療方案，Morgan將會(huì)根據(jù)醫(yī)囑回家休息并反饋給醫(yī)院康復(fù)情況，直至下次生病再前往醫(yī)院。

從上述示例中可以看到，研究團(tuán)隊(duì)為醫(yī)院主要設(shè)計(jì)了兩類角色：醫(yī)護(hù)人員和患者。所有的角色信息都是由大模型（GPT-3.5）生成，因而可以很輕松地?cái)U(kuò)展增加。部分角色的具體信息如下圖所示，35歲的患者Kenneth Morgan當(dāng)前患有急性鼻炎，且有高血壓病史，當(dāng)前有持續(xù)嘔吐等一系列癥狀；Zhao Lei則是一名經(jīng)驗(yàn)豐富的影像科醫(yī)生，內(nèi)科醫(yī)生Elise Martin具備優(yōu)秀的交流能力，擅長(zhǎng)內(nèi)科急/慢性疾病的診斷、治療。這些完整的人物信息背景提升了醫(yī)院模擬的真實(shí)性。

虛擬角色的信息簡(jiǎn)介

在上述醫(yī)療模擬過(guò)程中，疾病的產(chǎn)生是其中的關(guān)鍵。具體來(lái)說(shuō)，當(dāng)前的病歷信息是由大語(yǔ)言模型結(jié)合醫(yī)學(xué)知識(shí)為患者生成完整的病歷，包括疾病類型、癥狀、持續(xù)時(shí)間、各項(xiàng)檢查結(jié)果等（具體內(nèi)容可見(jiàn)論文附錄）。需要注意的是，為了盡可能保證整個(gè)模擬流程的準(zhǔn)確性，患者智能體只會(huì)感知到自己的疾病癥狀但不知道具體疾病，而醫(yī)生智能體則只能通過(guò)和患者智能體對(duì)話問(wèn)診和開(kāi)具檢查來(lái)了解信息。患者智能體需要進(jìn)行的檢查、所患疾病類型和疾病嚴(yán)重程度判斷將作為三個(gè)關(guān)鍵任務(wù)來(lái)評(píng)價(jià)醫(yī)學(xué)智能體對(duì)虛擬病人的診療能力。

智能體自我進(jìn)化

傳統(tǒng)的大部分醫(yī)學(xué)模型訓(xùn)練方法依賴于預(yù)訓(xùn)練、微調(diào)等技術(shù)，因而需要大量的醫(yī)學(xué)數(shù)據(jù)以及部分高質(zhì)量人工標(biāo)注數(shù)據(jù)的支持。然而，研究團(tuán)隊(duì)認(rèn)為，人類醫(yī)生能力提升過(guò)程不依賴這樣的海量數(shù)據(jù)，他們往往能從臨床實(shí)踐的診療過(guò)程中積累經(jīng)驗(yàn)，也會(huì)通過(guò)閱讀醫(yī)學(xué)文獻(xiàn)積累關(guān)鍵知識(shí)實(shí)現(xiàn)提升。在虛擬醫(yī)院中的醫(yī)療智能體應(yīng)該也能實(shí)現(xiàn)類似的能力進(jìn)化。因此，團(tuán)隊(duì)設(shè)計(jì)了名為“MedAgent-Zero”的智能體自我進(jìn)化算法，它如同AlphaGo-Zero一樣不依賴人工標(biāo)注數(shù)據(jù)，而是在虛擬醫(yī)院中利用學(xué)習(xí)（即閱讀醫(yī)學(xué)文獻(xiàn)）與實(shí)踐（即與虛擬病人交互并做診療決策）兩種途徑實(shí)現(xiàn)能力提升：一方面，醫(yī)學(xué)智能體可以按照上述診療流程，與虛擬病人進(jìn)行診療交互，在開(kāi)具檢查、疾病診斷和治療建議三個(gè)任務(wù)上自主積累經(jīng)驗(yàn)；另一方面，醫(yī)學(xué)智能體也會(huì)進(jìn)行自主學(xué)習(xí)，基于LLM生成的醫(yī)學(xué)問(wèn)題模擬醫(yī)學(xué)文檔的學(xué)習(xí)過(guò)程。

MedAgent-Zero策略流程示意圖

如上圖所示，MedAgent-Zero的進(jìn)化方式包括兩種途徑： 1) 從成功案例中總結(jié)經(jīng)驗(yàn)，對(duì)于能夠答對(duì)的診療問(wèn)題，智能體會(huì)像人類醫(yī)生一樣進(jìn)行病例庫(kù)經(jīng)驗(yàn)積累； 2) 從失敗案例中反思教訓(xùn)，在回答錯(cuò)誤時(shí)，智能體會(huì)主動(dòng)進(jìn)行錯(cuò)誤反思并進(jìn)行反思。如果反思的經(jīng)驗(yàn)教訓(xùn)能夠幫助智能體回答對(duì)該問(wèn)題，它將被保留下來(lái)并存儲(chǔ)在經(jīng)驗(yàn)庫(kù)中。

最終，研究團(tuán)隊(duì)將在虛擬數(shù)據(jù)上的訓(xùn)練過(guò)程中進(jìn)行上述兩方面的積累進(jìn)化。在每次推理過(guò)程中，智能體從兩個(gè)庫(kù)中檢索最相似的內(nèi)容并將其加入到Prompt中進(jìn)行In-context Learning，并根據(jù)回答的正確和錯(cuò)誤分別進(jìn)行病歷積累或者是經(jīng)驗(yàn)總結(jié)，從而實(shí)現(xiàn)智能體能力的持續(xù)提升。

醫(yī)學(xué)能力評(píng)價(jià)

在虛擬醫(yī)院中，研究團(tuán)隊(duì)構(gòu)造了上萬(wàn)名虛擬病人的病歷用于醫(yī)學(xué)智能體的自主進(jìn)化實(shí)驗(yàn)，包括甲流、乙流、新冠等8個(gè)呼吸道相關(guān)疾病，涉及十余種不同的醫(yī)學(xué)檢查。按照人類醫(yī)生一周治療約100名病人計(jì)算，人類醫(yī)生可能需要花兩年診斷10000名病人，但是智能體醫(yī)生只需要幾天就可以完成。

團(tuán)隊(duì)主要從兩方面對(duì)虛擬醫(yī)院中的醫(yī)學(xué)智能體進(jìn)行能力評(píng)價(jià)。首先是在虛擬環(huán)境中的醫(yī)學(xué)能力評(píng)價(jià)：如下圖所示，在醫(yī)學(xué)智能體的訓(xùn)練過(guò)程中（左圖），隨著診療病人的增加，醫(yī)學(xué)智能體在三個(gè)關(guān)鍵任務(wù)上的準(zhǔn)確率持續(xù)上升并逐漸趨于平穩(wěn)；而針對(duì)500個(gè)測(cè)試病歷的實(shí)驗(yàn)則發(fā)現(xiàn)（右圖），在診療病人數(shù)量增加的過(guò)程中智能體準(zhǔn)確率略有波動(dòng)，但整體呈現(xiàn)上升趨勢(shì)。

1F875

醫(yī)學(xué)智能體在訓(xùn)練集（左圖）和測(cè)試集（右圖）上的任務(wù)準(zhǔn)確率情況隨后，研究團(tuán)隊(duì)對(duì)比了醫(yī)學(xué)智能體進(jìn)化前后在各個(gè)疾病上的診斷準(zhǔn)確率，發(fā)現(xiàn)均有大幅提升，驗(yàn)證了其自主進(jìn)化的有效性。

20874

智能體進(jìn)化前后在不同疾病的診斷表現(xiàn)

另一方面，團(tuán)隊(duì)使用了外部數(shù)據(jù)集MedQA的呼吸道疾病子集用于評(píng)價(jià)醫(yī)學(xué)智能體在真實(shí)世界的醫(yī)學(xué)能力。令人驚訝的是，即便在智能體進(jìn)化的過(guò)程中沒(méi)有使用任何人工標(biāo)注的數(shù)據(jù)，在診療近萬(wàn)名病人后，醫(yī)學(xué)智能體能夠在該數(shù)據(jù)集上超越當(dāng)前最好的方法，達(dá)到了最高93.06%的準(zhǔn)確率，驗(yàn)證了模擬環(huán)境中醫(yī)學(xué)智能體自主進(jìn)化的有效性。

1395D

不同方法在MedQA子集上的正確率

此外，研究團(tuán)隊(duì)開(kāi)展了消融實(shí)驗(yàn)驗(yàn)證，結(jié)果表明不管是從成功中積累的樣例還是從失敗中總結(jié)的經(jīng)驗(yàn)都有助于提升模型的醫(yī)學(xué)能力。

BFF3

MedAgent-Zero的消融實(shí)驗(yàn)表現(xiàn) 綜上所述，該研究工作構(gòu)建了首個(gè)虛擬醫(yī)院場(chǎng)景Agent Hospital，并提出了不依賴人工數(shù)據(jù)標(biāo)注的醫(yī)學(xué)智能體進(jìn)化算法MedAgent-Zero。在虛擬數(shù)據(jù)和真實(shí)數(shù)據(jù)的實(shí)驗(yàn)結(jié)果初步驗(yàn)證了模擬環(huán)境對(duì)于醫(yī)學(xué)智能體能力提升的有效性，為人工智能特別是大語(yǔ)言模型和智能體技術(shù)在智慧醫(yī)療場(chǎng)景的應(yīng)用提出了新的解決方案。但該研究工作目前仍存在一定的局限性，未來(lái)團(tuán)隊(duì)將在覆蓋的疾病病種、模擬環(huán)境的細(xì)致程度以及模型基座的選擇與優(yōu)化等方面繼續(xù)完善優(yōu)化。

通訊作者簡(jiǎn)介

馬為之，清華大學(xué)智能產(chǎn)業(yè)研究院（AIR）助理研究員，入選中國(guó)科協(xié)“青年人才托舉工程”。研究方向?yàn)橹悄苄畔@取、智慧醫(yī)療。個(gè)人主頁(yè)：https://mawz12.github.io。

劉洋，清華大學(xué)萬(wàn)國(guó)數(shù)據(jù)教授、智能產(chǎn)業(yè)研究院（AIR）執(zhí)行院長(zhǎng)、計(jì)算機(jī)系副系主任，國(guó)家杰出青年基金獲得者。研究方向?yàn)槿斯ぶ悄堋⒆匀徽Z(yǔ)言處理與智慧醫(yī)療。個(gè)人主頁(yè)：https://nlp.csai.tsinghua.edu.cn/~ly。

網(wǎng)址: AIR科研｜AIR打造虛擬醫(yī)院，實(shí)現(xiàn)AI醫(yī)生自我進(jìn)化 http://m.u1s5d6.cn/newsview572644.html

91高清中文字幕|亚洲无码网站网址|欧美一区二区乱伦|a乱码精品一区二区三|成人一区二区毛片|国产日韩精品视频短片|不卡无码无需播放器|鲁噜精品免费视频|wwwh日韩中出|精品五月婷婷无码

AIR科研｜AIR打造虛擬醫(yī)院，實(shí)現(xiàn)AI醫(yī)生自我進(jìn)化

推薦資訊

從出汗看健康出汗透露你的健康信號(hào)

早上怎么喝水最健康？

91高清中文字幕|亚洲无码网站网址|欧美一区二区乱伦|a乱码精品一区二区三|成人一区二区毛片|国产日韩精品视频短片|不卡无码无需播放器|鲁噜精品免费视频|wwwh日韩中出|精品五月婷婷无码

AIR科研｜AIR打造虛擬醫(yī)院，實(shí)現(xiàn)AI醫(yī)生自我進(jìn)化

推薦資訊

從出汗看健康 出汗透露你的健康信號(hào)

早上怎么喝水最健康？

從出汗看健康出汗透露你的健康信號(hào)