首頁 資訊 2.證據(jù)的分級與推薦

2.證據(jù)的分級與推薦

來源:泰然健康網(wǎng) 時間:2024年12月06日 14:40

時間:2014/8/6 10:14:09 點擊:2616

一、證據(jù)分級與推薦的演進

要實現(xiàn)科學高效的決策,使用者不必花費大量時間和精力去檢索和評價證據(jù)質(zhì)量(Quality of Evidence),只需充分利用研究人員預先確立的證據(jù)分級標準和推薦意見,參考各種高質(zhì)量證據(jù)幫助科學決策。因此研究人員在創(chuàng)建和推廣證據(jù)分級標準和推薦意見時,必須力圖避免偏倚和多變,以減少誤導和濫用。但證據(jù)質(zhì)量良莠不齊,證據(jù)分級(Levels of Evidence)和推薦強度(Strength of Recommendations)標準也大相徑庭。20世紀60年代,美國兩位社會學家Campbell和Stanley首次提出了研究證據(jù)分級的思想,并引入內(nèi)部真實性和外部真實性的概念。1979年,加拿大定期體檢特別工作組(Canadian Task Force on the Periodic Health Examination,CTFPHE)首次對研究證據(jù)進行分級并給出推薦意見。此后多個機構(gòu)和組織分別對證據(jù)質(zhì)量和推薦強度進行了規(guī)范,但方法各異,標準不一,甚至彼此矛盾。如對證據(jù)級別的描述包括字母(如A,B,C等)、數(shù)字(如I,II,III等)和字母與數(shù)字混合(如Ia,Ib,IIa等),還有一些分級用符號和文字來描述,增加了分級的復雜性,不利于推廣和應(yīng)用?,F(xiàn)從分級特點、影響范圍、使用領(lǐng)域等角度出發(fā),遴選最具代表性的11個標準進行介紹與分析。

(一)CTFPHE標準

1979年,CTFPHE標準首次基于試驗設(shè)計將證據(jù)分為三級:設(shè)計良好的RCT級別最高,專家意見級別最低。將推薦強度按證據(jù)級別分為支持和不支持兩方面,每方面又分為充分,尚可和缺乏三類。這一標準不僅提高了決策的科學性,也大大方便了醫(yī)生的工作,該標準的單行本發(fā)行超過4萬冊。此后二十幾年,幾乎所有分級標準都在此基礎(chǔ)上擴展和延伸而成。但該標準沒有回答以下問題:

1. 樣本量小,質(zhì)量低的RCT也屬于I級證據(jù)嗎?

2. 結(jié)果互相矛盾的RCT仍然屬于I級證據(jù)嗎?

3. 高質(zhì)量觀察性研究仍屬于II級證據(jù)嗎?

1979年CTFPHE證據(jù)分級

Level

定義

I

至少1項設(shè)計良好的隨機對照試驗

II-1

設(shè)計良好的隊列或病例對照研究,尤其來自多個中心或研究組

II-2

在時間和地點上設(shè)置了對照的研究,不管是否有干預措施;或重大結(jié)果的非對照研究

(如1940年代青霉素的應(yīng)用)

III

基于臨床研究、描述性研究或?qū)<椅瘑T會的報告,或權(quán)威專家的意見

1979年CTFPHE推薦強度

Grade

定義

A

定期體檢中考慮該疾病的證據(jù)充分

B

定期體檢中考慮該疾病的證據(jù)尚可

C

定期體檢中支持考慮該疾病的證據(jù)缺乏

D

定期體檢中不考慮該疾病的證據(jù)尚可

E

定期體檢中不考慮該疾病的證據(jù)充分

(二)David Sackett與ACCP標準

1986年,CTFPHE成員之一的David Sackett針對1979年標準的以上不足,撰文提出了證據(jù)的五分法,首次對I級水平的RCT規(guī)定了質(zhì)量,即大樣本(I、II型錯誤都較低)RCT要好于小樣本(I、II型錯誤都較高)RCT,且將證據(jù)等級與推薦強度一一對應(yīng),即高質(zhì)量證據(jù)同時也是強推薦證據(jù),反之亦然。該標準簡潔明了,更適于指導臨床醫(yī)生,但卻忽視了低級別的證據(jù),未區(qū)分隊列研究與病例對照研究,也未納入專家意見。后來Gordon Guyatt及Deborah Cook等分別于1992、1995、1998、2001和2006年對其進一步修改和完善,主要用于指導美國胸科醫(yī)師學會(The American College of Chest Physicians,ACCP)抗血栓藥物的使用。

1986年證據(jù)分級及推薦強度

Level

定義

Grade

定義

I

有確定結(jié)果的大樣本RCT(I、II型錯誤都較低)

A

至少一項I級試驗支持

II

結(jié)果不確定的小樣本RCT(I、II型錯誤都較高)

B

至少一項II級試驗支持

III

非隨機的同期對照試驗

C

只有III、IV、V級證據(jù)支持

IV

非隨機的歷史對照試驗

V

無對照的系列病例報道

以上兩套系統(tǒng)產(chǎn)生于20世紀70~80年代,此時正是國際臨床流行病學和衛(wèi)生技術(shù)評估產(chǎn)生發(fā)展、醫(yī)學科研方法逐漸成熟、醫(yī)學繼續(xù)教育空前繁榮的時代。1972年,英國醫(yī)生Archie Cochrane的經(jīng)典著作《療效與效益:健康服務(wù)中的隨機反映》更是喚起了人們對醫(yī)學決策科學性和衛(wèi)生資源合理配置、高效使用的深刻反思。加拿大研究者首次從試驗設(shè)計角度對證據(jù)進行分級,明確提出研究證據(jù)優(yōu)于專家經(jīng)驗,不僅成為醫(yī)學工作者決策的重要依據(jù),也成為后來誕生的循證醫(yī)學的基本理念之一。

(三)AHRQ標準

1992年,美國衛(wèi)生保健政策研究所(Agency for Health Care Policy and Research,AHCPR,現(xiàn)更名Agency for Healthcare Research and Quality,AHRQ)制定的臨床實踐指南,將隨機對照試驗的Meta分析作為最高級別的證據(jù),并向全國推廣。

1992年AHCPR證據(jù)分級及推薦強度

Level

定義

Grade

定義

I a

隨機對照試驗的Meta分析

A

I a

I b

至少1項隨機對照試驗

I b

II a

至少1項設(shè)計良好的非隨機對照試驗

B

II a

II b

至少1項設(shè)計良好的準實驗性研究

II b

III

設(shè)計良好的非試驗性研究,如對照研究、相關(guān)性研究和病例研究

III

IV

專家委員會報告、權(quán)威意見或臨床經(jīng)驗

C

IV

(四)NEEBGDP與SIGN標準

1996年,英格蘭北部循證指南制定項目(North of England Evidence Based Guidelines Development Project,NEEBGDP)發(fā)布了他們制定的證據(jù)分級標準和推薦強度(表3-7),將RCT,Meta分析和系統(tǒng)評價共同作為最高級別的證據(jù),這是英國繼加拿大和美國之后較系統(tǒng)全面發(fā)布自己的分級標準。2001年,蘇格蘭院際指南網(wǎng)絡(luò)(The Scottish Intercollegiate Guidelines Network,SIGN)發(fā)布了更詳細的證據(jù)分級和推薦強度。荷蘭、新西蘭、澳大利亞等國先后在臨床指南中也引入或修訂了各自的證據(jù)分級和推薦標準。

1996年NEEBGDP證據(jù)等級

Level

定義

Grade

定義

I

基于設(shè)計良好的隨機對照試驗meta分析,系統(tǒng)評價

A

直接基于I級證據(jù)的推薦

II

基于設(shè)計良好的隊列研究或病例對照研究

B

直接基于II級證據(jù)或由I級證據(jù)外推而來的推薦

III

基于非對照研究或一致的建議

C

直接基于III級證據(jù)的或由II級證據(jù)外推而來的推薦

2001年SIGN證據(jù)分級及推薦強度

Level

定義

Grade

定義

1++

隨機對照試驗的高質(zhì)量Meta分析、系統(tǒng)評價,或偏倚可能性很小的隨機對照試驗

A

直接適用于目標人群的1++或1+級證據(jù)

1+

隨機對照試驗質(zhì)量較高的Meta分析、系統(tǒng)評價,或出現(xiàn)偏倚可能性小的隨機對照試驗

1-

隨機對照試驗的Meta分析、系統(tǒng)評價,或出現(xiàn)偏倚可能性大的隨機對照試驗

2++

病例對照或隊列研究的高質(zhì)量系統(tǒng)評價,或出現(xiàn)混雜、偏倚和機遇可能性很小而反映因果關(guān)聯(lián)可能性大的、高質(zhì)量病例對照或隊列研究

B

直接適用于目標人群的2++級證據(jù)或1++或1+級證據(jù)的外推證據(jù)

2+

出現(xiàn)混雜、偏倚和機遇可能性小而反映因果關(guān)聯(lián)可能性較大的、較高質(zhì)量的病例對照或隊列研究

C

直接適用于目標人群的2+級證據(jù)或2++級證據(jù)的外推證據(jù)

2-

出現(xiàn)混雜、偏倚和機遇可能性大而反映因素關(guān)聯(lián)可能性明顯不足的病例對照或隊列研究

3

非分析性研究,即病例報告、系列病例分析

D

3或4級證據(jù),或2+級證據(jù)的外推證據(jù)

4

專家意見

(五)牛津大學循證醫(yī)學中心標準

以上證據(jù)分級系統(tǒng)逐漸趨于成熟和完善,但仍局限于治療方面,不適用于預防、診斷等其他領(lǐng)域。

1998年,由臨床流行病學和循證醫(yī)學專家Bob Phillips,Chris Ball,Dave Sackett等人共同循證制定了新的分級標準,2001年5月正式發(fā)表于英國牛津循證醫(yī)學中心的網(wǎng)絡(luò)上(表3-9)。該標準首次在證據(jù)分級的基礎(chǔ)上整合了分類概念,涉及治療、預防、病因、危害、預后、診斷、經(jīng)濟學分析等7個方面,更具針對性和適應(yīng)性,已成為循證醫(yī)學教學和循證臨床實踐中公認的經(jīng)典標準,也是循證教科書和循證期刊最廣泛使用的標準,但由于其過于復雜和繁瑣,初次接觸循證醫(yī)學的醫(yī)生或醫(yī)學生難于理解和掌握。

2001牛津證據(jù)分級與推薦意見強度

推薦

級別

證據(jù)

水平

防治與病因

預后

診斷

經(jīng)濟分析

A

Ⅰa

同質(zhì)性RCTs的系統(tǒng)評價(SR)

同質(zhì)性前瞻性隊列研究的系統(tǒng)評價或有試驗基礎(chǔ)可靠的臨床指南

同質(zhì)性好的診斷性試驗的系統(tǒng)評價或有可靠試驗基礎(chǔ)的臨床指南

同質(zhì)性好的經(jīng)濟研究的系統(tǒng)評價

Ⅰb

可信區(qū)間窄的RCT

隨訪率≥80%的前瞻性隊列研究

全部患者均同步做金標準和診斷試驗檢查且作獨立的盲法比較

全部可靠的備選結(jié)果對適當費用測量的比較分析,包括將臨床研究觀察到的變異結(jié)合到重要變量中的敏感性分析

Ⅰc

“全或無”效應(yīng)

“全或無效應(yīng)”的病例系列:如具有某些預后因素的系列患者,或全部避免某種結(jié)局;或全部呈現(xiàn)某種特殊結(jié)局(如死亡)

絕對特異度高即陽性患者則可確診;絕對敏感度高即陰性患者則可排除;

對干預措施進行分析后能鑒別:

1.成本低其效果佳的程度

2.成本高其效果差的程度

3.成本相同其效果好壞的程度

B

Ⅱa

同質(zhì)性隊列研究的系統(tǒng)評價

1.同質(zhì)性回顧性隊列研究

2.隨機對照實驗組未治療者的同質(zhì)性系統(tǒng)評價

同質(zhì)性的但水平低于Ⅰ級的診斷性研究的系統(tǒng)評價

同質(zhì)性的但水平低于Ⅰ級的經(jīng)濟學研究的系統(tǒng)評價

Ⅱb

單個的隊列研究(包括低質(zhì)量的RCT如追蹤率<80%者)

1.回顧性隊列研究

2.在RCT中未作治療的對照組患者之追蹤結(jié)果

3.驗證尚未確認的臨床指南

1.均同步作了金標準及診斷試驗,也進行了獨立盲法比較但研究對象局限且不連貫

2.驗證尚未確認的臨床指南

若干備選結(jié)果對適當費用測量的比較分析,包括將臨床可觀察到的變異結(jié)合到重要變量中的敏感性

分析

Ⅱc

“結(jié)局”性研究

“結(jié)局”性研究

B

Ⅲa

同質(zhì)性病例-對照研究的系統(tǒng)評價

Ⅲb

單個病例-對照研究

研究對象未全部作金標準檢查,但作了適當指標的獨立盲法比較

無準確的成本

測量但對重要臨

床變量作了敏感

性分析

C

IV

病例系列報告、低質(zhì)量隊列研究及病例對照研究

病例系列報告、低質(zhì)量的預后隊列研究

未獨立利用金標準或未作盲法試驗

無敏感性分析

D

V

專家意見(缺乏嚴格評價或僅依據(jù)生理學/基礎(chǔ)研究/初始概念)

同左

同左

專家意見(缺乏嚴格評價或僅依據(jù)經(jīng)濟理論)

20世紀90年代循證醫(yī)學的迅猛發(fā)展,Cochrane協(xié)作網(wǎng)的全球參與,證據(jù)分級的逐漸成熟,標志著一個以證據(jù)為基礎(chǔ)的新醫(yī)學時代到來。以上分級標準的共同特點是:針對臨床,用于指南,傳播廣泛,影響權(quán)威,推薦意見的強度與證據(jù)級別對應(yīng)。但最大的不足是主要從設(shè)計質(zhì)量評價,不利于終端用戶使用且標準各異、內(nèi)容復雜、應(yīng)用局限。

(六)GRADE標準

2000年,針對當時證據(jù)分級與推薦意見存在的不足,包括WHO在內(nèi)的19個國家和國際組織共同創(chuàng)立GRADE(Grading of Recommendations Assessment,Development and Evaluation)工作組,由67名包括臨床指南專家、循證醫(yī)學專家、各重要標準的主要制定者及證據(jù)研究人員構(gòu)成,旨在通力協(xié)作,循證制定出國際統(tǒng)一的證據(jù)質(zhì)量分級和推薦強度系統(tǒng),并于2004年正式推出。2008年,GRADE工作組在BMJ上發(fā)表了6篇系列文章,首次全面介紹了GRADE方法,并推出了配套軟件GRADEpro。2011年,GRADE工作組對在BMJ上發(fā)表的6篇系列文章進行了全面更新,擴展至22篇系列文章,在Journal of Clinical Epidemiology上陸續(xù)發(fā)表,以便為GRADE的目標用戶(包括系統(tǒng)評價及衛(wèi)生技術(shù)評估作者、指南委員會成員及為指南委員會提供支持的方法學家們)提供更詳盡的指導。目前,該組織已有200余名成員。由于其更加科學合理,過程透明,適用性強,目前包括WHO和Cochrane協(xié)作網(wǎng)在內(nèi)的74個國際組織、協(xié)會已經(jīng)采納GRADE標準(http://www.gradeworkinggroup.org/society/index.htm),成為證據(jù)發(fā)展史上的里程碑事件。

GRADE證據(jù)等級

質(zhì)量等級

當前定義(2011年)

早前定義(2008年)

我們非常確信真實的效應(yīng)值接近效應(yīng)估計值

進一步研究非常不可能改變我們對效應(yīng)估計值的確信程度

對效應(yīng)估計值我們有中等程度的信心:真實值有可能接近估計值,但仍存在二者大不相同的可能性

進一步研究有可能對我們對效應(yīng)估計值的確信程度造成重要影響,且可能改變該估計值

我們對效應(yīng)估計值的確信程度有限:真實值可能與估計值大不相同

進一步研究很有可能對我們對效應(yīng)估計值的確信程度造成重要影響,且很可能改變該估計值

極低

我們對效應(yīng)估計值幾乎沒有信心:真實值很可能與估計值大不相同

任何效應(yīng)估計值都是非常不確定的

2004年GRADE推薦強度

Grade

具體描述

明確顯示干預措施利大于弊或弊大于利

利弊不確定或無論質(zhì)量高低的證據(jù)均顯示利弊相當

(七)其他標準

2001年,美國紐約州立大學下州醫(yī)學中心推出證據(jù)金字塔(圖3-1),首次將動物研究和體外研究納入證據(jù)分級系統(tǒng),拓展了證據(jù)的范疇,加之簡潔明了,形象直觀,傳播非常廣泛。

2005年,Aragon等借鑒循證醫(yī)學方法,專門針對獸醫(yī)外科研究證據(jù)進行分級(表3-12),盡管尚不完善,也無推薦意見,但仍不失為將證據(jù)分類分級理念引入基礎(chǔ)研究的有益探索。

2004年3月,中國循證醫(yī)學中心首次在??漆t(yī)師分類研究中引入證據(jù)分級的概念。2006年2月至2007年10月,中國循證醫(yī)學中心及其分中心相繼發(fā)表9篇有關(guān)醫(yī)療風險的系列文章,針對管理領(lǐng)域尚無證據(jù)概念和分類分級標準體系與意識的現(xiàn)狀,借鑒循證醫(yī)學有效性證據(jù)分類分級的成功經(jīng)驗,首次對管理證據(jù)進行分級,將政府及相關(guān)機構(gòu)報告列為僅次于系統(tǒng)評價、HTA和Meta分析的證據(jù),并根據(jù)研究目的分類,為證據(jù)在非臨床領(lǐng)域的使用做了積極探索。這些標準拓展延伸了證據(jù)的應(yīng)用范圍和領(lǐng)域,有益地補充了GRADE小組的工作。

中國循證醫(yī)學中心對管理證據(jù)的分級與定義

2004年

2006年

Levels

定義

Levels

定義

A

系統(tǒng)評價

A

系統(tǒng)評價,Meta分析,HTA

B

官方指南

B

政府及相關(guān)機構(gòu)報告

C

有確切研究方法的文獻

C

有確切研究方法的文獻

D

綜述

D

綜述

E

專家意見

E

專家意見

上述證據(jù)分級標準與推薦情況見下表。隨著循證醫(yī)學方法和概念更廣泛傳播和更深入使用,證據(jù)分級和推薦強度的理念也不斷拓展和深入。

11個證據(jù)分級一覽表

時間

國家

制定者

分級

特點

適用于

1979

加拿大

CTFPHE

三級

第一次基于試驗設(shè)計對研究證據(jù)分級

預防體檢

1986

加拿大

Sackett

五級

考慮證據(jù)質(zhì)量

臨床用藥

1992

美國

AHCPR

四級

納入Meta分析

臨床指南

1996

英國

NEEBGDP

三級

納入系統(tǒng)評價

臨床指南

2001

英國

SIGN

八級

同時將系統(tǒng)評價、Meta分析與RCT作為最高證據(jù)

臨床指南

2001

美國

SUNY Downstate Medical Center

九級

納入動物實驗和體外研究

臨床指南

2001

英國

CEBM

五級

引入分類概念

衛(wèi)生保健

2004

國際

GRADE

四級

考慮研究的設(shè)計、質(zhì)量、結(jié)果一致性和證據(jù)的直接性

衛(wèi)生保健

2004

中國

李幼平

五級

非醫(yī)藥領(lǐng)域分級

科學研究

2005

美國

Aragon

四級

針對動物研究分級

基礎(chǔ)研究

2006

中國

李幼平

五級

決策與管理領(lǐng)域分級

政府決策

上一篇:1.證據(jù)的分類

下一篇:3. 證據(jù)檢索的思路

用戶登陸 Login   站內(nèi)搜索 Search   熱門文章 Hot

相關(guān)知識

2024 CSCO小細胞肺癌指南重磅更新!化療“骨髓防彈衣”曲拉西利獲I級推薦、1A類證據(jù)
上海飲料分ABCD級,推薦性遞減,那么C級D級還能喝嗎?
綠色健康分級認證
嬰標認證零食推薦
【推薦】健康狀況證明
清脂效果超級好的8種食物推薦
營養(yǎng)師證等級制度詳解:證書分幾級?報考是否需要逐級進行?
《AECOPD病人早期肺康復運動訓練的最佳證據(jù)總結(jié)》的學習
電子病歷系統(tǒng)分級評價平臺數(shù)據(jù)填報
初級小兒推拿保健師證怎么考的 小兒推拿保健師要考什么證

網(wǎng)址: 2.證據(jù)的分級與推薦 http://m.u1s5d6.cn/newsview315582.html

推薦資訊