健康飲食領域知識圖譜構(gòu)建與應用研究
摘要:
在過去的40年里,發(fā)展中國家經(jīng)濟的高速發(fā)展引起了人民膳食結(jié)構(gòu)的顯著變化,肉類產(chǎn)品消費量增長,慢性疾病成為人類健康的主要殺手,在這種背景下,人們對于獲取健康飲食知識的需求日益增長。幸運的是,互聯(lián)網(wǎng)創(chuàng)造了一個健康飲食信息的搜索、學習和共享平臺,但這些信息紛繁復雜,涉及到食物種類、營養(yǎng)、醫(yī)療等多個方面,且分布在多個數(shù)據(jù)源上,為用戶的檢索和學習帶來困難。如何整合這些知識,挖掘隱含在半結(jié)構(gòu)和非結(jié)構(gòu)文本中的概念和語義關(guān)系,為健康食物的檢索系統(tǒng)提供更加豐富的語義信息是一個具有重要意義的研究問題。目前,學術(shù)界和工業(yè)界將解決這一問題的方法聚焦在知識圖譜領域,基于知識圖譜技術(shù)出現(xiàn)了許多健康方面的研究和應用系統(tǒng),但是多數(shù)知識圖譜集中在專業(yè)醫(yī)療領域,其中實體和關(guān)系多數(shù)來自于專家定義、已有知識庫等結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),從互聯(lián)網(wǎng)自然語言中提取知識進行自動構(gòu)建的方案不多,此外,與英文相比,已有的中文領域知識庫和訓練語料很少,為知識整合帶來挑戰(zhàn)。本文針對健康飲食數(shù)據(jù)的特點,定義了知識圖譜中主要包含的五個實體,分別是食材、菜品、營養(yǎng)元素、癥狀和人群,然后從多個健康網(wǎng)站中獲取半結(jié)構(gòu)和非結(jié)構(gòu)的文本數(shù)據(jù),進行實體識別、關(guān)系識別、食物實體對齊,構(gòu)建中文健康飲食知識圖譜并提供了概念檢索案例,所提出的模型和方法在小規(guī)模訓練集上有良好的表現(xiàn)。本文的主要研究內(nèi)容和貢獻如下:(1)定義了一個健康飲食領域知識圖譜的數(shù)據(jù)模式,即圖譜的模式層包含的實體類別、屬性和實體之間的關(guān)系。(2)構(gòu)建領域詞典,定義多種領域特征,并將其融入條件隨機場算法中進行實體和關(guān)系識別,對自然語言短文中的癥狀、人群、營養(yǎng)元素三類實體進行了抽取,利用機器學習分類算法對它們和食物之間的關(guān)系進行分類。(3)實現(xiàn)了一個食物實體對齊的方法,主要解決食物名稱的多樣性問題,對相同的食物實體進行整合。(4)基于所構(gòu)建的知識圖譜提出多概念語義檢索的應用模型。實驗結(jié)果表明,本文實現(xiàn)的實體識別、關(guān)系分類和實體融合算法具有較高的準確率和召回率,可以保證所構(gòu)建的知識圖譜具有較高的質(zhì)量。為驗證知識圖譜的應用價值,本文基于該知識圖譜設計了多概念檢索模型,并實現(xiàn)了一個原型系統(tǒng),可以有效管理和檢索知識圖譜中維護的概念、實體以及它們之間的語義關(guān)系,可以幫助非專業(yè)用戶更加高效全面地檢索和學習健康飲食知識。
展開
相關(guān)知識
基于中醫(yī)與營養(yǎng)學的健康飲食知識圖譜構(gòu)建
研究領域
國內(nèi)大數(shù)據(jù)與膳食營養(yǎng)健康的研究及應用進展
守護人類健康:人工智能賦能醫(yī)療領域創(chuàng)新應用
注冊食品科學研究院的研究領域有哪些?
植物性飲食在運動營養(yǎng)領域中的應用研究進展
中國食品發(fā)酵工業(yè)研究院有限公司 > 科研創(chuàng)新 > 研發(fā)領域
人工智能在醫(yī)療健康領域中的應用
2023年合成生物學在健康與醫(yī)藥領域的應用
全球環(huán)境與健康領域的研究熱點,以及我國環(huán)境與健康研究面臨的機遇與挑戰(zhàn)
網(wǎng)址: 健康飲食領域知識圖譜構(gòu)建與應用研究 http://m.u1s5d6.cn/newsview795074.html
推薦資訊
- 1發(fā)朋友圈對老公徹底失望的心情 12775
- 2BMI體重指數(shù)計算公式是什么 11235
- 3補腎吃什么 補腎最佳食物推薦 11199
- 4性生活姿勢有哪些 盤點夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線基礎代謝率(BMR)計算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826