Reliability and Validity of Self
摘要: 本文利用2008年“中國(guó)流動(dòng)與健康調(diào)查”(IMHC)數(shù)據(jù), 分析了自評(píng)一般健康指標(biāo)的信度和效度。研究發(fā)現(xiàn), 自評(píng)一般健康具有較好的信度, 被訪(fǎng)者先后兩次回答的結(jié)果高度一致, 兩次回答結(jié)果的微小變動(dòng)表現(xiàn)為隨機(jī)性的波動(dòng), 而非系統(tǒng)性偏差。該指標(biāo)在一定程度上會(huì)受到調(diào)查中題目次序效應(yīng)的影響。關(guān)于自評(píng)一般健康指標(biāo)效度的分析發(fā)現(xiàn), 該指標(biāo)能夠有效反映被訪(fǎng)者自我感知的各種健康狀態(tài)和個(gè)體既有的關(guān)于自身健康的知識(shí), 但不能很好地反映個(gè)體無(wú)法感知的機(jī)體變化等健康問(wèn)題。自評(píng)一般健康存在較為復(fù)雜的回答偏誤問(wèn)題, 受不同年齡、社會(huì)經(jīng)濟(jì)地位群體關(guān)于健康的評(píng)價(jià)標(biāo)準(zhǔn)、期望與認(rèn)知差異的影響, 其回答結(jié)果在不同人群中的可比性值得商榷。
Abstract: Using data from the 2008 Survey of Internal Migration and Health in China, this study examines the reliability and validity of self-rated general health for the Chinese population. Results show that self-rated general health is a highly reliable measure of individual health. Two repeated measures of self-rated general health in the survey are quite consistent and the difference between the two answers reflects random variations rather than any systematic biases. Nonetheless, there is also some evidence that self-rated general health is likely to be affected by question orders in a survey.In addition, this study examines the validity and potential reporting bias of self-rated general health by fitting Hopit models. Results show that self-rated general health is a valid summary measure of individual's self-perceived and known health conditions, although it does not reflect bodily functional changes that can hardly be perceived. The response of self-rated general health is strongly correlated with respondent's chronic medical conditions, the occurrence of acute illness, self-perceived pains/discomfort, insomnia symptoms and depression; however, it is only weakly correlated with objective biometrics such as blood pressure and lung capacity.Finally, it is worth noting that there exists complicated reporting heterogeneity in self-rated general health among different social groups. Due to differences in rating standard, expectation and cognitive capability regarding health, different social groups respond to the question of self-rated general health differently. After controlling for all the specific measures of individual health in the data, older respondents tend to underestimate their true health status, while those better educated and respondents with higher family incomes tend to overestimate their true health conditions. The existence of reporting heterogeneity is likely to hamper the cross-population comparability of self-rated general health.
Key words: self-rated general health reliability validity reporting heterogeneity
自20世紀(jì)80年代以來(lái),健康不平等問(wèn)題及其社會(huì)影響因素日益成為社會(huì)科學(xué)研究的熱點(diǎn)之一。1受研究成本、技術(shù)和手段的限制(如問(wèn)卷調(diào)查方法),自評(píng)一般健康(self-rated general health)指標(biāo)成為社會(huì)研究者分析健康問(wèn)題的首選工具。與其他健康指標(biāo)相比,自評(píng)一般健康通過(guò)詢(xún)問(wèn)被訪(fǎng)者一個(gè)單一的問(wèn)題來(lái)測(cè)量其健康狀況,2操作簡(jiǎn)便,成本很低,目前已經(jīng)在許多大型社會(huì)調(diào)查中得到普遍應(yīng)用,并通過(guò)對(duì)該指標(biāo)的分析也產(chǎn)生了大量的研究成果。不過(guò),自評(píng)一般健康指標(biāo)的信度和效度問(wèn)題也一直是學(xué)術(shù)界關(guān)注和爭(zhēng)論的焦點(diǎn)(Jylh?,2009;Mathers,2003;Sadana, et al., 2002;Thomas and Frankenberg, 2002)。這樣一個(gè)簡(jiǎn)單問(wèn)題能夠在多大程度上反映被訪(fǎng)者的真實(shí)健康狀況?其測(cè)量的穩(wěn)定性如何?對(duì)于這些問(wèn)題,學(xué)術(shù)界還未達(dá)成共識(shí),仍有待于在相應(yīng)領(lǐng)域做進(jìn)一步的深入探討。
到目前為止,國(guó)際學(xué)術(shù)界關(guān)于自評(píng)一般健康指標(biāo)的信度和效度的研究成果已相當(dāng)豐富,但在中國(guó)相關(guān)問(wèn)題所受到的關(guān)注仍非常有限??紤]到大量國(guó)際研究主要使用西方發(fā)達(dá)國(guó)家的數(shù)據(jù)資料,其研究結(jié)論的普適性仍有待檢驗(yàn)。本文旨在利用中國(guó)的調(diào)查數(shù)據(jù),就該問(wèn)題提供新的證據(jù)資料,以期為推動(dòng)健康問(wèn)題的社會(huì)理論發(fā)展貢獻(xiàn)新的知識(shí)。具體而言,本文的主要研究問(wèn)題包括:第一,自評(píng)一般健康的測(cè)量是否具有穩(wěn)定性?換句話(huà)說(shuō),如果針對(duì)同一調(diào)查對(duì)象重復(fù)進(jìn)行測(cè)量,所得到的結(jié)果是否一致?如果不一致,是哪些因素導(dǎo)致了這種變化?第二,自評(píng)一般健康是否能夠反映被訪(fǎng)者的真實(shí)健康狀況?它與其他健康指標(biāo)之間的關(guān)系如何?使用自評(píng)一般健康指標(biāo)來(lái)考察不同社會(huì)群體的健康差異時(shí)是否會(huì)導(dǎo)致系統(tǒng)性偏誤?本文接下來(lái)將首先簡(jiǎn)單回顧和梳理針對(duì)自評(píng)一般健康信度和效度問(wèn)題的既有研究成果與相關(guān)爭(zhēng)論,再介紹本研究所使用的主要數(shù)據(jù)以及分析方法。在第三部分,筆者將利用較新的中國(guó)調(diào)查數(shù)據(jù)分析自評(píng)一般健康的信度、效度和可能的回答偏誤問(wèn)題。最后,對(duì)本研究的主要發(fā)現(xiàn)進(jìn)行簡(jiǎn)單的總結(jié)和討論。
一、既有研究評(píng)述(一) 健康的概念及其測(cè)量
按照世界衛(wèi)生組織(WHO,1946)的定義,健康是指“一種身體、精神和社會(huì)的完全安寧狀態(tài),不僅僅是沒(méi)有疾病或體質(zhì)虛弱”。由此可見(jiàn),健康是一個(gè)復(fù)雜、多維的概念,在實(shí)際研究中很難通過(guò)某項(xiàng)單一的指標(biāo)來(lái)反映個(gè)體健康的所有維度。穆雷和陳(Murray and Chen, 1992)認(rèn)為,個(gè)體健康狀況實(shí)際上包括三個(gè)不同的組成部分:能夠自我感知但通過(guò)外部手段難以觀(guān)測(cè)的疼痛和不適感、既能自我感知又能觀(guān)測(cè)到的機(jī)體變化,以及無(wú)法自我感知但卻可以測(cè)量到的機(jī)體變化。其中,前兩個(gè)部分的信息可以通過(guò)個(gè)體的自我感知獲得,后兩個(gè)部分的信息可以通過(guò)醫(yī)學(xué)檢測(cè)手段獲知。因此,要想全面了解個(gè)體的健康狀況,就有必要同時(shí)收集自評(píng)健康指標(biāo)和客觀(guān)體測(cè)結(jié)果。當(dāng)然,自我感知的健康狀況與醫(yī)學(xué)觀(guān)察結(jié)果并不必然一致,這是因?yàn)樗鼈兯从车慕】稻S度本身就存在差異。
自我感知的健康狀況既取決于機(jī)體病理負(fù)擔(dān),還受個(gè)體自身的社會(huì)和文化背景的影響。健康自評(píng)取決于被訪(fǎng)者與參照群體或者自認(rèn)的理想健康狀態(tài)進(jìn)行比較的結(jié)果,這兩者都可能因?yàn)樵谏鐣?huì)文化方面的差異而不同。盡管如此,自評(píng)健康指標(biāo)在健康研究中仍具有非常重要的價(jià)值,個(gè)人對(duì)疾病負(fù)擔(dān)的主觀(guān)評(píng)價(jià)與認(rèn)知對(duì)個(gè)體生活質(zhì)量的影響甚至比一些客觀(guān)的健康指標(biāo)更為關(guān)鍵(Murray and Chen, 1992),因此,關(guān)于疾病的自我感知情況本身就是值得研究的社會(huì)現(xiàn)象。
(二) 關(guān)于自評(píng)一般健康指標(biāo)的爭(zhēng)論
在現(xiàn)實(shí)應(yīng)用中,由于成本和可操作性等方面的限制,大型的社會(huì)調(diào)查一般只收集被訪(fǎng)者自報(bào)或自評(píng)的健康狀況信息,其中的自評(píng)一般健康已經(jīng)成為社會(huì)調(diào)查研究中使用最廣泛的一項(xiàng)健康指標(biāo)。
自評(píng)一般健康能否有效測(cè)量個(gè)體的真實(shí)健康狀況,尤其是在不同群體之間的自評(píng)一般健康是否具有可比性,對(duì)于這些問(wèn)題的回答,以往的研究充滿(mǎn)了爭(zhēng)議。一方面,有研究發(fā)現(xiàn),自評(píng)一般健康對(duì)個(gè)體死亡風(fēng)險(xiǎn)具有很強(qiáng)的預(yù)測(cè)效力(Bailis, et al., 2003;Benjamins, et al., 2004;Benyamini and Idler, 1999;Ferraro and Kelley-Moore, 2001;Frankenberg and Jones, 2004;Idler and Benyamini, 1997;Miilunpalo, et al., 1997;Van Doorslaer and Gerdtham, 2003);另一方面,也有研究指出,自評(píng)健康的回答行為在不同社會(huì)群體之間存在明顯的異質(zhì)性(reporting heterogeneity),因而該指標(biāo)在不同人群之間缺乏直接的可比性(Bound,1991;Groot,2000;Krause and Jay, 1994;Lindeboom and Van Doorslaer,2004;Sadana, et al., 2002;Salomon, et al., 2004;Sen,2002;Tandon, et al., 2002;Thomas and Frankenberg, 2002)。
伊德勒和本亞米尼(Idler and Benyamini, 1997)綜述了27項(xiàng)有關(guān)個(gè)體自評(píng)一般健康與死亡風(fēng)險(xiǎn)的研究成果,發(fā)現(xiàn)超過(guò)85%(23項(xiàng))的研究表明自評(píng)一般健康對(duì)個(gè)體的死亡風(fēng)險(xiǎn)具有獨(dú)立的顯著效應(yīng),自評(píng)一般健康較差的對(duì)象在跟蹤期內(nèi)死亡的風(fēng)險(xiǎn)明顯更高。這一效應(yīng)即便在控制了個(gè)體的社會(huì)人口特征、社會(huì)經(jīng)濟(jì)地位、社會(huì)網(wǎng)絡(luò)、健康行為,甚至客觀(guān)健康體測(cè)指標(biāo)后依然顯著。因此,他們認(rèn)為,自評(píng)一般健康是反映個(gè)體健康狀況的非常有效的綜合性指標(biāo)。與其他指標(biāo)相比,自評(píng)一般健康反映的信息更加綜合和更為全面,它包括了那些通過(guò)醫(yī)學(xué)手段無(wú)法檢測(cè)到的機(jī)體感覺(jué)和變化,代表著主體對(duì)疾病嚴(yán)重程度的綜合判斷和預(yù)測(cè),甚至隱含著被訪(fǎng)者家庭病史等與個(gè)體健康變化軌跡密切相關(guān)的重要內(nèi)容。在后續(xù)研究中,本亞米尼和伊德勒(Benyamini and Idler, 1999)進(jìn)一步回顧了在1995-1998年間發(fā)表的另外19篇相關(guān)文獻(xiàn)后發(fā)現(xiàn),盡管較新的研究使用了更為成熟的調(diào)查數(shù)據(jù)和分析方法,但這些研究同樣印證了個(gè)體自評(píng)一般健康與死亡風(fēng)險(xiǎn)的強(qiáng)相關(guān)關(guān)系。
費(fèi)拉羅和凱利摩爾(Ferraro and Kelley-Moore, 2001)認(rèn)為,以往研究中僅使用調(diào)查基期時(shí)的自評(píng)一般健康狀況,實(shí)際上導(dǎo)致了對(duì)個(gè)體自評(píng)一般健康和死亡風(fēng)險(xiǎn)之間關(guān)系的低估。他們利用美國(guó)健康與營(yíng)養(yǎng)監(jiān)測(cè)調(diào)查(the National Health and Nutrition Examination Survey)數(shù)據(jù)研究發(fā)現(xiàn),當(dāng)只考察被訪(fǎng)者基期的自評(píng)一般健康狀況時(shí),該指標(biāo)對(duì)死亡風(fēng)險(xiǎn)的效應(yīng)只在白人樣本中顯著,在黑人樣本中并不顯著。但當(dāng)把自評(píng)一般健康作為一個(gè)時(shí)變變量(time-varying covariate)納入模型后,無(wú)論是白人群體還是黑人群體,對(duì)死亡風(fēng)險(xiǎn)均有顯著的預(yù)測(cè)效力。本杰明斯等(Benjamins, et al., 2004)進(jìn)一步檢驗(yàn)了美國(guó)成年人自評(píng)一般健康與死因別死亡風(fēng)險(xiǎn)(cause-specific mortality risk)之間的關(guān)系,結(jié)果表明,在控制社會(huì)人口特征、基期健康狀況和健康行為后,自評(píng)一般健康狀況與死于糖尿病、傳染性疾病和呼吸道疾病的風(fēng)險(xiǎn)高度相關(guān),與死于心臟病、中風(fēng)和癌癥等的風(fēng)險(xiǎn)也具有較強(qiáng)的相關(guān)關(guān)系,但與死于意外事故、兇殺、自殺等的風(fēng)險(xiǎn)不存在顯著關(guān)系。這些結(jié)果進(jìn)一步印證了自評(píng)一般健康包含關(guān)于被訪(fǎng)者真實(shí)健康狀況的重要信息。弗蘭肯伯格和瓊斯(Frankenberg and Jones, 2004)對(duì)印度尼西亞家庭生活調(diào)查(the Indonesia Family Life Survey,IFLS)的三期跟蹤數(shù)據(jù)的分析表明,自評(píng)一般健康為“差”的個(gè)體在調(diào)查跟蹤期內(nèi)死亡的概率明顯高于自評(píng)一般健康為“好”的個(gè)體。相應(yīng)效應(yīng)在控制了調(diào)查對(duì)象營(yíng)養(yǎng)狀況、生理和機(jī)體活動(dòng)能力、高血壓以及抑郁等眾多健康指標(biāo)后仍然顯著。這一研究從發(fā)展中國(guó)家的數(shù)據(jù)出發(fā),為自評(píng)健康指標(biāo)的有效性提供了進(jìn)一步的支持。
盡管有大量研究支持自評(píng)一般健康與死亡風(fēng)險(xiǎn)密切相關(guān),但這些證據(jù)并沒(méi)有減少人們對(duì)使用自評(píng)健康指標(biāo)考察健康差異的質(zhì)疑,尤其是自評(píng)健康指標(biāo)可能帶來(lái)的回答偏誤(reporting biases)問(wèn)題,在不同人群之間的跨人群可比性仍是懸而未決的重要議題(Mathers,2003)。3
與自評(píng)一般健康和死亡風(fēng)險(xiǎn)的一致性關(guān)系的研究結(jié)果相對(duì)照,不少研究考察了自評(píng)健康指標(biāo)在測(cè)量個(gè)體真實(shí)健康狀況時(shí)可能導(dǎo)致的偏誤。例如,托馬斯和弗蘭肯伯格(Thomas and Frankenberg, 2002)指出,在評(píng)估自評(píng)健康指標(biāo)的效度時(shí),最大的困難在于我們對(duì)每個(gè)被訪(fǎng)者的“真實(shí)”健康狀況知之甚少。他們利用美國(guó)健康與營(yíng)養(yǎng)監(jiān)測(cè)調(diào)查數(shù)據(jù),比較了個(gè)體自報(bào)的身高、體重與客觀(guān)測(cè)量的身高和體重之間的關(guān)系,由于后者只受隨機(jī)測(cè)量誤差的影響,在一定程度上可以視為“真值”。分析結(jié)果顯示,與客觀(guān)測(cè)量結(jié)果相比,自報(bào)的身高和體重具有系統(tǒng)性的測(cè)量誤差,這些測(cè)量誤差與個(gè)體特征之間存在非常復(fù)雜的關(guān)系,因而難以有效修正。他們還利用印度尼西亞家庭生活調(diào)查(IFLS)數(shù)據(jù),分析了自評(píng)一般健康與其他生理健康指標(biāo)之間的關(guān)系,發(fā)現(xiàn)自評(píng)一般健康確實(shí)包含了關(guān)于個(gè)體健康狀況的重要信息,但同時(shí)也受到了個(gè)體特征與生活經(jīng)歷的影響,如社會(huì)經(jīng)濟(jì)地位、健康服務(wù)利用和關(guān)于怎樣才算是“健康”的個(gè)人標(biāo)準(zhǔn)等,都不同程度地影響著被訪(fǎng)者關(guān)于自評(píng)一般健康的回答結(jié)果。
薩達(dá)納等(Sadana, et al., 2002)認(rèn)為,對(duì)健康的界定標(biāo)準(zhǔn)、期望和認(rèn)知過(guò)程存在差異嚴(yán)重影響了自評(píng)健康指標(biāo)的跨人群可比性。基于對(duì)46個(gè)國(guó)家調(diào)查數(shù)據(jù)的比較分析,他們指出,男性被訪(fǎng)者的自評(píng)一般健康往往好于女性;在部分非洲國(guó)家,不同年齡群體的健康自評(píng)結(jié)果甚至不存在顯著差異,這明顯與常識(shí)相悖。這些分析結(jié)果表明,不同性別和年齡群體關(guān)于自評(píng)健康的回答可能存在明顯的異質(zhì)性,由此嚴(yán)重影響了自評(píng)一般健康在不同人群之間的可比性。即便在同一國(guó)家內(nèi)部,不同文化群體之間的健康自評(píng)也可能存在系統(tǒng)差異,例如,在以色列,盡管阿拉伯人比猶太人的預(yù)期壽命明顯更低,各種疾病發(fā)生率和死亡率普遍更高,但他們的自評(píng)健康狀況卻好于后者(Baron-Epel, et al., 2005)。
于爾海(Jylh?,2009)從健康自我評(píng)價(jià)的社會(huì)心理過(guò)程出發(fā),對(duì)這種回答行為的異質(zhì)性現(xiàn)象進(jìn)行解釋。他指出,從問(wèn)答心理的角度看,被訪(fǎng)者在回答自評(píng)一般健康問(wèn)題時(shí),首先需要界定什么是“健康”,在不同社會(huì)文化和時(shí)代背景下,這一定義可能存在差異。其次,被訪(fǎng)者會(huì)根據(jù)自己的界定從記憶中搜集回答問(wèn)題所需要的相關(guān)信息,如疾病史、機(jī)體功能、肢體感覺(jué)等。當(dāng)被訪(fǎng)者根據(jù)這些信息來(lái)判斷自己的健康狀況時(shí),往往將自身情況與一個(gè)參照群體做比較,而到底選擇怎樣的參照群體可能會(huì)因年齡、性別、生活經(jīng)歷而異。最后,當(dāng)被訪(fǎng)者形成了自己的最終判斷并依據(jù)題目所給出的選項(xiàng)進(jìn)行回答時(shí),在表達(dá)上的文化差異也可能會(huì)影響被訪(fǎng)者傾向于選擇哪一個(gè)選項(xiàng)。
如何有效辨識(shí)和調(diào)整自評(píng)健康指標(biāo)可能存在的回答偏誤問(wèn)題,目前已成為國(guó)際健康比較研究中的熱點(diǎn)和難點(diǎn)之一。其中,一種可行的策略是,在調(diào)查中加入輔助的固定情境(anchoring vignettes)問(wèn)題,即要求被訪(fǎng)者在評(píng)價(jià)自身健康的同時(shí),還根據(jù)假想的情境描述評(píng)價(jià)一系列特定的健康狀況。這樣,可以通過(guò)這些輔助的虛擬情境問(wèn)題識(shí)別每個(gè)被訪(fǎng)者的回答模式,并據(jù)此調(diào)整自評(píng)一般健康回答行為的異質(zhì)性以及由此造成的偏誤(劉寶、胡善聯(lián),2005;Jones, et al., 2007;King, et al., 2004;Murray, et al., 2002;Salomon, et al., 2004;Tandon, et al., 2002)。
另一種考察自評(píng)一般健康的回答偏誤問(wèn)題的方法是,在調(diào)查數(shù)據(jù)中同時(shí)收集其他能夠有效反映被訪(fǎng)者真實(shí)健康狀況的詳細(xì)信息(Iburg, et al., 2002;Jürges,2007;Lindeboom and Van Doorslaer,2004)。該方法的基本思路是,如果我們能夠在一定程度上掌握被訪(fǎng)者的真實(shí)健康狀況,那么將自評(píng)一般健康狀況與之相比,其中的差異自然反映了自評(píng)一般健康指標(biāo)所包含的回答偏誤。例如,林德布姆和范杜爾斯勒(Lindeboom and Van Doorslaer,2004)利用麥克馬斯特健康效用指數(shù)(McMaster Health Utility Index,HUI)測(cè)度被訪(fǎng)者的“真實(shí)”健康狀況,分析了加拿大居民關(guān)于自評(píng)一般健康回答行為的異質(zhì)性問(wèn)題。
為了進(jìn)一步探討和檢驗(yàn)自評(píng)一般健康的效度,本文利用中國(guó)較新的健康調(diào)查數(shù)據(jù),綜合調(diào)查數(shù)據(jù)收集的不同維度的主客觀(guān)健康指標(biāo),以模擬個(gè)體的“真實(shí)”健康狀況,從而借助上述方法來(lái)考察自評(píng)一般健康與“真實(shí)”健康狀況的一致性。
二、數(shù)據(jù)與方法(一) 數(shù)據(jù)
本研究的數(shù)據(jù)取自2008年“中國(guó)流動(dòng)與健康調(diào)查”(The Survey of Internal Migration and Health in China,IMHC)。該項(xiàng)目是由美國(guó)加州大學(xué)洛杉磯分校和中國(guó)首都醫(yī)科大學(xué)聯(lián)合完成的全國(guó)性調(diào)查項(xiàng)目。4調(diào)查采用分層整群隨機(jī)抽樣,在中國(guó)28個(gè)省、自治區(qū)、直轄市隨機(jī)選取的150個(gè)鎮(zhèn)級(jí)單位,共調(diào)查了3 000名18-64歲的被訪(fǎng)者。調(diào)查問(wèn)卷的內(nèi)容包括被訪(fǎng)者的基本社會(huì)人口信息、遷移流動(dòng)史、教育和職業(yè)經(jīng)歷、婚姻和家庭狀況、被訪(fǎng)者的心理健康狀況等。在由專(zhuān)業(yè)調(diào)查員完成問(wèn)卷調(diào)查的同時(shí),經(jīng)過(guò)培訓(xùn)的社區(qū)醫(yī)務(wù)人員繼續(xù)詢(xún)問(wèn)了被訪(fǎng)者的既往病史和生理健康狀況,并為被訪(fǎng)者進(jìn)行了簡(jiǎn)單的體驗(yàn)。
IMHC調(diào)查先后兩次詢(xún)問(wèn)了被訪(fǎng)者的自評(píng)一般健康狀況。第一次是在整個(gè)調(diào)查中作為關(guān)于健康的第一個(gè)問(wèn)題,由專(zhuān)業(yè)調(diào)查員完成提問(wèn);第二次是臨近調(diào)查的末尾,由社區(qū)醫(yī)務(wù)人員詢(xún)問(wèn)了被訪(fǎng)者詳盡的疾病史和具體健康狀況等問(wèn)題后,要求被訪(fǎng)者重新評(píng)價(jià)自己的一般健康狀況。這兩次測(cè)量結(jié)果和調(diào)查收集的其他主客觀(guān)健康信息為本文分析自評(píng)一般健康的信度和效度提供了重要的數(shù)據(jù)基礎(chǔ)。表 1列出了本研究所使用的主要健康指標(biāo)及其界定標(biāo)準(zhǔn)。

(二) 方法
本文的分析主要包括兩個(gè)部分。首先,對(duì)IMHC調(diào)查中自評(píng)一般健康的兩次回答結(jié)果進(jìn)行交叉列聯(lián)表分析,考察自評(píng)一般健康的信度。在此基礎(chǔ)上,擬合定序Probit模型,探討影響兩次測(cè)量結(jié)果之間一致性的可能因素。其次,本文借鑒林德布姆和范杜爾斯勒(Lindeboom and Van Doorslaer,2004)的方法,通過(guò)擬合層級(jí)定序Probit模型(Hierarchical Ordered Probit Model,HOPIT),以檢驗(yàn)自評(píng)一般健康的效度,以及可能存在的回答偏誤問(wèn)題。與普通的定序模型相比,該模型允許結(jié)果變量的各回答類(lèi)別之間的切點(diǎn)(cut points)可以隨被訪(fǎng)者個(gè)體特征的變動(dòng)而變動(dòng)。通過(guò)對(duì)比不同被訪(fǎng)者自評(píng)健康切點(diǎn)位置的差異,可以有效辨識(shí)不同群體回答行為的異質(zhì)性,從而考察自評(píng)健康指標(biāo)的跨人群可比性問(wèn)題。
在定序Probit模型中,假定存在一個(gè)關(guān)于真實(shí)健康狀況的連續(xù)性潛變量(H*),將自評(píng)一般健康(Hs)視為對(duì)該潛變量的一種粗糙測(cè)量,二者之間的關(guān)系可表示為:
$ {H^s} = i Leftrightarrow {c_{i - 1}} < {H^*} le {c_i}, ;;;i = 1, cdots, k $ (1)其中,k表示自評(píng)一般健康所包括的類(lèi)別數(shù),ci為相應(yīng)的切點(diǎn),并有c0=-∞和ck=+∞。在Hopit模型中,允許切點(diǎn)ci隨著個(gè)體特征(X)如年齡、性別、社會(huì)經(jīng)濟(jì)地位等的變動(dòng)而變動(dòng),也即:
$ {c_i} = {g_i}(mathit{X}{beta _i}), ;;;i{rm{ = 1, }} cdots, mathit{k}{rm{ - 1}} $ (2)由于真實(shí)健康狀況(H*)往往是無(wú)法直接觀(guān)測(cè)的,本文將真實(shí)健康狀況定義為IMHC調(diào)查數(shù)據(jù)中所收集的一系列多維度主客觀(guān)健康測(cè)量指標(biāo)(H0)的函數(shù)。這些測(cè)量指標(biāo)包括慢性病史、急性病狀況、疼痛和不適感、心理健康狀況和一系列客觀(guān)的體測(cè)指標(biāo)。這樣就有:
$ {H^*} = f({mathit{H}^0}, varepsilon ;alpha) $ (3)將式(2)、(3)帶入式(1),本文所構(gòu)建的Hopit模型可表示為:
$ {H^s} = i Leftrightarrow {g_{i - 1}}(mathit{X}{rm{;}}{beta _{i - 1}}) < f({mathit{H}^{rm{0}}}, varepsilon ;alpha) le {g_i}(mathit{X}{rm{;}}{beta _i}) $ (4)式(4)是對(duì)Hopit模型一般形式的簡(jiǎn)化。其一般形式不僅允許真實(shí)健康狀況(H*)表示為其他健康測(cè)量指標(biāo)(H0)的函數(shù),而且真實(shí)健康狀況也可以隨著其他個(gè)體特征變量(X)的變化而變化,即:
$ {H^*} = f({mathit{H}^0}, mathit{X}{rm{, }}varepsilon {rm{;}}alpha {rm{, }}gamma) $ (5)以及
$ {H^s} = i Leftrightarrow {g_{i - 1}}({X}{rm{;}}{beta _{i - 1}}) < f({{H}^0},{X}{rm{,}}varepsilon {rm{;}}alpha {rm{,}}gamma ) le {g_i}({X}{rm{;}}{beta _i}) $ (6)由模型的待估計(jì)參數(shù)個(gè)數(shù)與模型約束條件可知,除非數(shù)據(jù)中包含固定情境變量等額外信息或者對(duì)模型參數(shù)設(shè)定人為的約束條件,當(dāng)相同的個(gè)體特征變量既出現(xiàn)在關(guān)于自評(píng)一般健康的切點(diǎn)(ci)的函數(shù)中,又出現(xiàn)在關(guān)于真實(shí)健康狀況的函數(shù)中時(shí),模型(6)無(wú)法擬合。相比之下,它的簡(jiǎn)化形式模型(4)是可以擬合的,其隱含假定是,H0反映了所有基于真實(shí)健康狀況導(dǎo)致的自評(píng)一般健康的差異,因而自評(píng)一般健康的其他殘余變異都是由被訪(fǎng)者回答行為的異質(zhì)性引起的,這些異質(zhì)性可以由個(gè)體特征來(lái)預(yù)測(cè)和解釋。
在定序Probit模型的框架下,式(4)可以進(jìn)一步表示為:
$ begin{array}{l} {rm{Pr(}}{mathit{H}^s}{rm{ = }}mathit{i}{rm{) = }}mathit{Phi }left[ {frac{{{g_i}(mathit{X}{rm{;}}{beta _i}) - f{rm{(}}{mathit{H}^0}{rm{;}}alpha {rm{)}}}}{sigma }} right] ;;;;;;;;;;;;;;; - mathit{Phi }left[ {frac{{{g_{i - 1}}(mathit{X}{rm{;}}{beta _{i - 1}}) - f({mathit{H}^0}{rm{;}}alpha)}}{sigma }} right] end{array} $ (7)其中,Φ(·)表示標(biāo)準(zhǔn)正態(tài)分布累積分布函數(shù)。
三、主要分析結(jié)果(一) 自評(píng)一般健康的信度分析
如前所述,在IMHC調(diào)查中,先后兩次詢(xún)問(wèn)了被訪(fǎng)者的自評(píng)一般健康狀況。表 2列出了被訪(fǎng)者針對(duì)同一問(wèn)題的兩次回答結(jié)果的交叉列聯(lián)表??傮w來(lái)說(shuō),這兩次測(cè)量的結(jié)果具有很強(qiáng)的正相關(guān)關(guān)系(γ=0.768,SE=0.013)。表 2中主對(duì)角線(xiàn)上的數(shù)值(即兩次回答結(jié)果一致)明顯高于其他數(shù)值,這表明,自評(píng)一般健康在相當(dāng)程度上是穩(wěn)定和一致的健康測(cè)量指標(biāo)。不過(guò),如表 2所示,在兩次測(cè)量中,仍然有部分被訪(fǎng)者改變了對(duì)自己的健康評(píng)價(jià)結(jié)果,這種改變主要發(fā)生在相鄰類(lèi)別之間。例如,在第一次自評(píng)健康為“很好”的被訪(fǎng)者中,有30%的人第二次的回答結(jié)果為“好”;第一次回答“差”的被訪(fǎng)者中,有33%的人第二次回答結(jié)果為“一般”。相比之下,在兩次測(cè)量中評(píng)價(jià)結(jié)果從“很好”變成了“差”(或是相反)的被訪(fǎng)者比例很低(分別約為1%和3%)。

將兩次關(guān)于自評(píng)一般健康的回答結(jié)果進(jìn)行對(duì)比,利用第二次回答結(jié)果的值減去第一次的值,可以產(chǎn)生一個(gè)表示兩次回答差異的新變量。根據(jù)兩次回答差異的方向,筆者將這個(gè)新變量劃分為以下三個(gè)類(lèi)別:變好(23%)、保持一致(62%)和變差(15%)。通過(guò)對(duì)該變量擬合定序Probit模型,分析兩次回答結(jié)果之間的變化究竟受到哪些因素影響。
這里所考察的可能影響因素包括被訪(fǎng)者的年齡和性別等基本社會(huì)人口特征,反映被訪(fǎng)者社會(huì)經(jīng)濟(jì)地位的居住地、教育程度和家庭收入等變量,以及與被訪(fǎng)者具體健康狀況和健康行為有關(guān)的變量。表 3給出了相應(yīng)變量的樣本分布情況。

表 4展示了針對(duì)自評(píng)一般健康兩次回答的差異擬合的定序Probit模型結(jié)果。其中,模型1只考慮了被訪(fǎng)者的年齡、性別、居住地、受教育程度和家庭收入等基本社會(huì)人口特征和社會(huì)經(jīng)濟(jì)變量,數(shù)據(jù)結(jié)果顯示,這些變量對(duì)因變量的預(yù)測(cè)能力有限,所有的模型系數(shù)均不顯著。這表明,兩次關(guān)于自評(píng)一般健康狀況的回答差異跟被訪(fǎng)者的人口和社會(huì)經(jīng)濟(jì)特征無(wú)關(guān),而更多地表現(xiàn)為一種隨機(jī)波動(dòng)。

模型2在模型1的基礎(chǔ)上加入了多項(xiàng)與被訪(fǎng)者健康狀況有關(guān)的變量,包括慢性病史、急性病狀況、身體的疼痛或不適感、抑郁和失眠等自報(bào)/自評(píng)健康指標(biāo),鍛煉身體、吸煙和飲酒等健康行為指標(biāo),以及體質(zhì)指數(shù)(BMI)、血壓和肺活量等客觀(guān)體測(cè)指標(biāo)。在調(diào)查實(shí)施過(guò)程中,上述自報(bào)/自評(píng)健康指標(biāo)和健康行為指標(biāo)是在兩次詢(xún)問(wèn)自評(píng)一般健康狀況之間進(jìn)行調(diào)查的。因此,模型2也旨在檢驗(yàn)自評(píng)一般健康在調(diào)查中的題目次序效應(yīng)(order effect)。模型2顯示,被訪(fǎng)者對(duì)自評(píng)一般健康問(wèn)題的回答確實(shí)受到了題目次序效應(yīng)的影響。具體而言,那些在過(guò)去一個(gè)月內(nèi)患過(guò)急性病、過(guò)去三個(gè)月間有較多身體疼痛或不適感和失眠癥狀更嚴(yán)重的被訪(fǎng)者,其自評(píng)一般健康的第二次回答結(jié)果明顯比第一次變差(相應(yīng)回歸系數(shù)分別在0.1、0.05和0.01的統(tǒng)計(jì)水平上顯著)。這表明,詳細(xì)的健康問(wèn)詢(xún)可能對(duì)被訪(fǎng)者具有提醒效應(yīng),使之能更全面地評(píng)價(jià)自己的健康狀況。與之相反,有抑郁癥狀的被訪(fǎng)者第二次關(guān)于自評(píng)一般健康狀況的回答結(jié)果反倒比第一次的回答顯著變好。這可能是因?yàn)椋{(diào)查開(kāi)始時(shí)與抑郁癥狀相關(guān)的消極情緒使這些被訪(fǎng)者對(duì)很多問(wèn)題的評(píng)價(jià)要比實(shí)際情況更為負(fù)面。但是,隨著具體健康狀況問(wèn)題的展開(kāi),這些被訪(fǎng)者在詳細(xì)回顧了自身的各項(xiàng)健康指標(biāo)后,傾向于對(duì)開(kāi)始過(guò)于負(fù)面的評(píng)價(jià)予以修正。模型2中的其他變量(包括健康行為、客觀(guān)體測(cè)指標(biāo)等)的回歸系數(shù)都不顯著,表明這些變量對(duì)兩次自評(píng)一般健康回答結(jié)果的一致性不存在明顯的效應(yīng)。
(二) 自評(píng)一般健康的效度分析
在關(guān)于自評(píng)一般健康指標(biāo)的信度分析之外,本文以下部分對(duì)該指標(biāo)的效度進(jìn)行了考察。具體而言,本研究結(jié)合使用IMHC調(diào)查收集的一系列主客觀(guān)健康指標(biāo)(見(jiàn)表 1),假設(shè)被訪(fǎng)者的“真實(shí)”健康狀況可表示為這些健康指標(biāo)的函數(shù),從而擬合Hopit模型以考察自評(píng)一般健康指標(biāo)的有效性。在本文的Hopit模型中,分別以?xún)纱巫栽u(píng)一般健康的回答結(jié)果作為因變量,模型允許自評(píng)一般健康的切點(diǎn)可以隨被訪(fǎng)者的年齡、性別、居住地、受教育程度和家庭收入的變動(dòng)而變動(dòng)。
表 5給出了具體的模型擬合結(jié)果。由表 5可見(jiàn),自評(píng)一般健康的兩次測(cè)量結(jié)果與其他自評(píng)或自報(bào)健康指標(biāo)均表現(xiàn)出強(qiáng)相關(guān)關(guān)系,不過(guò),它們與客觀(guān)體測(cè)指標(biāo)的關(guān)系明顯較弱。具體而言,兩次自評(píng)一般健康的回答結(jié)果與被訪(fǎng)者自報(bào)的慢性病史、急性病狀況、抑郁和疼痛感具有顯著的相關(guān)關(guān)系。有自報(bào)“曾被確診過(guò)的慢性病數(shù)量越多”、“在過(guò)去30天內(nèi)患過(guò)至少一種急性病”和“有較多疼痛或不適感”的被訪(fǎng)者的自評(píng)一般健康狀況明顯較差。類(lèi)似地,有抑郁癥狀的被訪(fǎng)者自評(píng)一般健康狀況也明顯不如其他被訪(fǎng)者。失眠癥狀與自評(píng)一般健康狀況也存在一定的關(guān)系,不過(guò),相應(yīng)關(guān)系僅在第二次自評(píng)一般健康回答結(jié)果的模型中具有統(tǒng)計(jì)顯著性,失眠癥狀越嚴(yán)重的被訪(fǎng)者,其自評(píng)一般健康狀況明顯較差。

與上述結(jié)果形成明顯對(duì)照的是,兩次測(cè)量的自評(píng)一般健康狀況與模型中所包括的客觀(guān)體測(cè)指標(biāo)只存在微弱的關(guān)系。事實(shí)上,只有體質(zhì)指數(shù)(BMI)與兩次自評(píng)一般健康結(jié)果具有顯著的相關(guān)關(guān)系。與體重正常的被訪(fǎng)者(BMI為18.5-25)相比,體重偏輕的被訪(fǎng)者(BMI在18.5以下)的自評(píng)一般健康狀況顯著更差。第二次測(cè)量的自評(píng)一般健康結(jié)果與高血壓也存在一定的相關(guān)性,即臨床診斷為高血壓的被訪(fǎng)者其自評(píng)一般健康狀況較差,相應(yīng)回歸系數(shù)僅在0.1的統(tǒng)計(jì)水平上顯著。
概括而言,本文的分析結(jié)果表明,自評(píng)一般健康可以很好地反映特定維度的個(gè)體健康狀況,尤其是那些能夠自我感知的身心狀況和已知的疾病經(jīng)歷,如既往病史、疼痛感和心理疾病等,但它在反映那些個(gè)體不易察覺(jué)的機(jī)體變化時(shí)其效度值得懷疑(Murray and Chen, 1992),具體表現(xiàn)為自評(píng)一般健康指標(biāo)與客觀(guān)體測(cè)指標(biāo)之間的弱相關(guān)關(guān)系。
在控制了每個(gè)被訪(fǎng)者的“真實(shí)”健康狀況后,Hopit模型將自評(píng)一般健康指標(biāo)所有殘余的變異歸結(jié)于不同個(gè)體回答行為的異質(zhì)性,也即切點(diǎn)位移(cut-point shifts)現(xiàn)象。由模型結(jié)果可知,對(duì)于兩次自評(píng)一般健康狀況的回答結(jié)果,其各類(lèi)別對(duì)應(yīng)的切點(diǎn)均存在明顯的年齡差異。模型中所有關(guān)于年齡的主效應(yīng)的估計(jì)系數(shù)均為負(fù),這表明年齡較大的群體自評(píng)一般健康的切點(diǎn)小于年輕群體,也即,給定同樣的“真實(shí)”健康狀況,老年人對(duì)自己的健康評(píng)價(jià)似乎更加悲觀(guān)。由于切點(diǎn)的取值較小,在“真實(shí)”健康狀況相同的情況下,老年人在回答自評(píng)一般健康問(wèn)題時(shí),選擇任何一個(gè)較好類(lèi)別的概率均較低(如選擇“很好”而不是“好/一般/差”、“很好/好”而不是“一般/差”、或者“很好/好/一般”而不是“差”的可能性更小)。模型中年齡的二次項(xiàng)效應(yīng)為正,表明這種差異隨著年齡的上升有逐漸縮小的趨勢(shì)。
模型結(jié)果還顯示,在不同受教育程度和家庭收入水平的被訪(fǎng)者之間,也存在一定的切點(diǎn)位移問(wèn)題。與受教育程度為“小學(xué)及以下”的被訪(fǎng)者相比,“大專(zhuān)及以上”的被訪(fǎng)者自評(píng)一般健康狀況的第三個(gè)切點(diǎn)取值明顯更大。這表明,給定“同等”的健康狀況,受過(guò)高等教育的被訪(fǎng)者比教育程度為“小學(xué)及以下”的被訪(fǎng)者自評(píng)一般健康回答為“差”的可能性更小。相比之下,家庭收入的效應(yīng)更多反映在前兩個(gè)切點(diǎn)上。模型中家庭收入的效應(yīng)均為正,表明給定“真實(shí)”健康水平,家庭富裕的被訪(fǎng)者更有可能對(duì)自己的健康狀況評(píng)價(jià)較高。
此外,在兩個(gè)模型中,性別對(duì)各切點(diǎn)的效應(yīng)在0.05的統(tǒng)計(jì)水平上均不顯著。這顯示,兩性之間自評(píng)一般健康的差異主要反映了他們關(guān)于既往病史的了解和身體對(duì)病痛感知敏感程度等方面的差異,而不是兩者回答行為的不同。城鄉(xiāng)居民關(guān)于自評(píng)一般健康的回答行為的差異主要反映在第二次測(cè)量的第三個(gè)切點(diǎn),即回答結(jié)果為“很好/好/一般”和“差”之間。與城鎮(zhèn)居民相比,農(nóng)村居民的相應(yīng)切點(diǎn)取值更小,表明在控制了模型中所有已測(cè)量的健康差異后,農(nóng)村居民回答自評(píng)一般健康為“差”的可能性顯著高于城鎮(zhèn)居民。
通過(guò)以上分析不難看出,自評(píng)一般健康能夠有效反映被訪(fǎng)者對(duì)身心健康狀況的自我感知和綜合認(rèn)知。與此同時(shí),該指標(biāo)也存在相當(dāng)復(fù)雜的回答偏誤問(wèn)題。這些回答偏誤主要是由于不同年齡和不同社會(huì)經(jīng)濟(jì)地位的被訪(fǎng)者對(duì)健康的評(píng)價(jià)標(biāo)準(zhǔn)、期望和認(rèn)知水平等方面存在差異,由此影響了他們對(duì)自評(píng)一般健康的回答結(jié)果及其可比性。
四、結(jié)論與討論
本文利用“中國(guó)流動(dòng)與健康調(diào)查”數(shù)據(jù),考察了自評(píng)一般健康指標(biāo)的信度和效度。研究發(fā)現(xiàn),盡管自評(píng)一般健康僅僅是一項(xiàng)單一的主觀(guān)性指標(biāo),但仍然具有較好的信度,調(diào)查中被訪(fǎng)者對(duì)該問(wèn)題先后兩次回答的結(jié)果高度一致。通過(guò)對(duì)兩次回答結(jié)果中變動(dòng)的情況擬合定序Probit模型發(fā)現(xiàn),這些變動(dòng)具有很強(qiáng)的隨機(jī)性,被訪(fǎng)者的個(gè)體社會(huì)經(jīng)濟(jì)特征等因素對(duì)相應(yīng)變動(dòng)并不具有顯著的影響。被訪(fǎng)者對(duì)自評(píng)一般健康的回答在一定程度上會(huì)受到調(diào)查中題目次序的影響。在提問(wèn)自評(píng)一般健康問(wèn)題之前先對(duì)被訪(fǎng)者提問(wèn)一系列具體的健康問(wèn)題,有助于被訪(fǎng)者更加全面和客觀(guān)地評(píng)價(jià)自己的綜合健康狀況。例如,本文的模型結(jié)果顯示,在回答了一系列具體健康問(wèn)題之后,那些近期曾患過(guò)急性病、存在經(jīng)常性身體疼痛或不適感和失眠嚴(yán)重的被訪(fǎng)者均調(diào)低了對(duì)自己一般健康狀況的評(píng)價(jià)。與之相反,有抑郁癥狀的被訪(fǎng)者反倒調(diào)高了對(duì)自己健康狀況的評(píng)價(jià),這可能反映了與抑郁相關(guān)的消極情緒和過(guò)度負(fù)面心理對(duì)自評(píng)健康存在負(fù)向影響,通過(guò)整理和回答具體的健康問(wèn)題有助于減緩這種負(fù)面心理的影響,從而使被訪(fǎng)者能夠更加客觀(guān)地看待自己的健康狀況。
此外,本文還通過(guò)擬合Hopit模型分析了自評(píng)一般健康的效度和回答偏誤問(wèn)題。分析結(jié)果表明,自評(píng)一般健康狀況與被訪(fǎng)者的其他自評(píng)或自報(bào)健康指標(biāo)具有高度相關(guān)關(guān)系,但與客觀(guān)健康體測(cè)指標(biāo)的關(guān)系則相對(duì)較弱。被訪(fǎng)者的慢性病史、近期是否患過(guò)急性病、身體疼痛或不適感、失眠、抑郁等狀況都對(duì)自評(píng)一般健康具有很強(qiáng)的效應(yīng),這表明自評(píng)一般健康能夠較為綜合有效地反映個(gè)體自我感知的健康狀況。但是,自評(píng)一般健康與本文所使用的客觀(guān)體測(cè)指標(biāo)關(guān)系微弱,這說(shuō)明它難以反映那些個(gè)體不易覺(jué)察的機(jī)體變化,如血壓、肺活量等。由此可見(jiàn),自評(píng)一般健康能夠有效反映被訪(fǎng)者個(gè)人感知的身體和精神狀況,但并不能反映健康的所有維度。有鑒于此,在相關(guān)健康調(diào)查研究中同時(shí)收集各個(gè)維度主客觀(guān)的健康信息,對(duì)于全面、深刻地認(rèn)識(shí)健康問(wèn)題及其社會(huì)影響因素必不可少。
值得注意的是,本文的分析結(jié)果還表明,自評(píng)一般健康存在較為復(fù)雜的回答偏誤問(wèn)題。受到不同被訪(fǎng)者關(guān)于健康的評(píng)價(jià)標(biāo)準(zhǔn)、期望和認(rèn)知水平差異的影響,自評(píng)一般健康的回答結(jié)果顯示出了明顯的回答行為異質(zhì)性或切點(diǎn)位移問(wèn)題。即便在控制了本文所考察的這些具體健康差異后,老年群體仍然更傾向于“低估”自己的健康狀況,而受教育程度較高、家庭收入較高的群體則傾向于更“樂(lè)觀(guān)”地評(píng)價(jià)自己的健康狀況。這在一定程度上會(huì)影響自評(píng)一般健康指標(biāo)的跨人群可比性。
盡管如此,自評(píng)一般健康仍然是反映個(gè)體健康狀況的最重要的指標(biāo)之一。雖然不同群體關(guān)于自評(píng)一般健康的回答模式可能具有一定的系統(tǒng)差異,針對(duì)自評(píng)一般健康進(jìn)行的比較研究仍能在一定程度上有效反映不同人群在許多方面的健康差異,包括慢性病史、急性病狀況、身體疼痛感和心理健康狀況等。而這些方面的健康問(wèn)題或者難以通過(guò)客觀(guān)體測(cè)指標(biāo)進(jìn)行反映,或者極有可能受?chē)?yán)重測(cè)量誤差的干擾(Bound,1991;Murray and Chen, 1992)。因此,基于健康概念本身的復(fù)雜性和多維性,一方面,我們不能寄希望通過(guò)任何一項(xiàng)單一的指標(biāo)就能反映個(gè)體健康狀況的所有維度,另一方面,本文的研究結(jié)論也表明,在眾多健康指標(biāo)中,自評(píng)一般健康仍不失為一項(xiàng)較為綜合有效的測(cè)度指標(biāo)。
最后,盡管本文所擬合的Hopit模型為檢驗(yàn)自評(píng)一般健康的回答偏誤問(wèn)題提供了依據(jù),但這一方法仍存在一定的局限性。由于該方法假設(shè)能夠準(zhǔn)確測(cè)量個(gè)體的真實(shí)健康狀況,任何與“真實(shí)”健康測(cè)量不同的殘余健康差異都?xì)w結(jié)為回答行為的異質(zhì)性,因此,利用該方法的分析結(jié)果對(duì)“真實(shí)”健康狀況的測(cè)量高度敏感。在現(xiàn)實(shí)中,很難構(gòu)建一個(gè)或一組健康指標(biāo)來(lái)全面反映個(gè)體的真實(shí)健康狀況,我們對(duì)此只能通過(guò)盡可能廣泛、有效的健康指標(biāo)來(lái)與之近似。在本文的分析中,筆者利用了“中國(guó)流動(dòng)與健康調(diào)查”中所收集的豐富的主客觀(guān)健康信息來(lái)對(duì)被訪(fǎng)者的“真實(shí)“健康狀況進(jìn)行近似,但自評(píng)一般健康所反映的信息仍然有可能超出了這些可測(cè)量的健康指標(biāo)的范疇。因此,本文關(guān)于自評(píng)健康回答行為異質(zhì)性的結(jié)論具有一定的嘗試性,其準(zhǔn)確性和穩(wěn)健性仍有待后續(xù)研究的進(jìn)一步檢驗(yàn)。更有效地解答相關(guān)研究問(wèn)題,還有待于我們?cè)诮】道碚摵脱芯糠椒ㄉ闲碌耐黄啤?/p>
注釋?zhuān)?
1.相關(guān)評(píng)述可參見(jiàn):王曲、劉民權(quán)(2005)。
2.自評(píng)一般健康是指在問(wèn)卷調(diào)查中詢(xún)問(wèn)被訪(fǎng)者以下問(wèn)題:“總的來(lái)說(shuō),您認(rèn)為您的健康狀況怎么樣?”回答選項(xiàng)一般由3-5個(gè)定序類(lèi)別組成,不同調(diào)查的具體措辭可能存在細(xì)微差別。
3.值得指出的是,相應(yīng)爭(zhēng)議不僅出現(xiàn)在關(guān)于自評(píng)健康指標(biāo)的應(yīng)用中,還廣泛存在于其他針對(duì)主觀(guān)性調(diào)查指標(biāo)的研究中,如幸福感、滿(mǎn)意度等(王廣州、王軍,2013)。
有關(guān)該項(xiàng)目的進(jìn)一步介紹,請(qǐng)參見(jiàn)項(xiàng)目網(wǎng)站:http://www.ccpr.ucla.edu/IM-China。
參考文獻(xiàn)(Reference)
[]劉寶, 胡善聯(lián). 2005.人群自報(bào)健康資料切點(diǎn)位移偏倚的校正——健康情景方法.中國(guó)衛(wèi)生統(tǒng)計(jì)(5): 314-317.
[]王廣州, 王軍. 2013.中國(guó)家庭幸福感測(cè)量.社會(huì), 33(6): 139-160.
[]王曲, 劉民權(quán). 2005.健康的價(jià)值及若干決定因素:文獻(xiàn)綜述.經(jīng)濟(jì)學(xué)季刊(1): 1-52.
[]Bailis Daniel, Alexander Segall, Judith G.Chipperfield. 2003.Two Views of Self-Rated General Health Status.Social Science & Medicine, 56(2): 203-217.
[]Baron-Epel Orna, Giora Kaplan, Amalia Haviv-Messika, Jalal Tarabeia, Manfred S. Green, Dorit Nitzan Kaluski. 2005.Self-Reported Health as a Cultural Health Determinant in Arab and Jewish Israelis.Social Science & Medicine, 61(6): 1256-1266.
[]Benjamins, Maureen Reindl, Robert A. Hummer, Isaac W. Eberstein, Charles B. Nam. 2004.Self-Reported Health and Adult Mortality Risk:An Analysis of Cause-Specific Mortality.Social Sciences & Medicine, 59(6): 1297-1306.
[]Benyamini, Yael and Ellen L. Idler. 1999. "Community Studies Reporting Association between Self-Rated Health and Mortality: Addtional Studies, 1995 to 1998. "Research on Aging 21(3): 392-401.
[]Bound John. 1991.Self-Reported Versus Objective Measures of Health in Retirement Models.The Journal of Human Resources, 26(1): 106-138.DOI:10.2307/145718
[]Ferraro, Kenneth F., Jessica A. Kelley-Moore. 2001.Self-Rated Health and Mortality among Black and White Adults:Examining the Dynamic Evaluation Thesis.Journal of Gerontology:Social Sciences, 56B(4): S195-S205.
[]Frankenberg Elizabeth, Nathan R. Jones. 2004.Self-Rated Health and Mortality:Does the Relationship Extend to a Low Income Setting?.Journal of Health and Social Behavior, 45(4): 441-452.DOI:10.1177/002214650404500406
[]Groot Wim. 2000.Adaptation and Scale of Reference Bias in Self-Assessments of Quality of Life.Journal of Health Economics, 19(3): 403-420.DOI:10.1016/S0167-6296(99)00037-5
[]Iburg, Kim Moesgaard, Joshua A. Salomon, Ajay Tandon, and Christopher J. L. Murray. 2002. "Cross-Population Comparability of Physician-Assessed and Self-Reported Measures of Health. "In Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications, edited by Christopher J. L. Murray, Joshua A. Salomon, Colin D. Mathers, and Alan D. Lopez. World Health Organization: Geneva: 433-448.
[]Idler Ellen L., Yael Benyamini. 1997.Self-Rated Health and Mortality:A Review of Twenty-Seven Community Studies.Journal of Health and Social Behavior, 38(1): 21-37.DOI:10.2307/2955359
[]Jones Andrew M., Nigel Rice, Teresa Bago d'Uva, Silvia Balia. 2007.Applied Health Economics.London and New York:Routledge.
[]Jürges Hedrik. 2007.True Health vs. Response Styles:Exploring Cross-Country Differences in Self-Reported Health.Health Economics, 16(2): 163-178.DOI:10.1002/hec.1134
[]Jylh? Marja J.M., Guralnik L., Ferrucci J.Jokela, Heikkinen E.. 1998.Is Self-Rated Health Comparable across Cultures and Genders?.Journal of Gerontology Series B:Psychological Sciences and Social Sciences, 53(3): S144-S152.
[]Jylh? Marja. 2009.What is Self-Rated Health and Why does it Predict Mortality?Towards a Unified Conceptual Model.Social Science & Medicine, 69(3): 307-316.
[]King Gary, Christopher J.L. Murray, Joshua A. Salomon, Ajay Tandon. 2004.Enhancing the Validity and Cross-Cultural Comparability of Measurement in Survey Research.American Political Science Review, 98(1): 191-207.DOI:10.1017/S000305540400108X
[]Krause Neal M., Gina M. Jay. 1994.What do Global Self-Rated Health Items Measure?.Medical Care, 32(9): 930-942.DOI:10.1097/00005650-199409000-00004
[]Lindeboom Maarten, Eddy van Doorslaer. 2004.Cut-Point Shift and Index Shift in Self-Reported Health.Journal of Health Economics, 23(6): 1083-1099.DOI:10.1016/j.jhealeco.2004.01.002
[]Mathers Colin D. 2003.Commentary:Towards Valid and Comparable Measurement of Population Health.Bulletin of the World Health Organization, 81(11): 787-788.
[]Miilunpalo Seppo, Ilkka Vuori, Pekka Oja, Matti Pasanen, Helka Urponen. 1997.Self-Rated Health Status as a Health Measure:The Predictive Value of Self-Reported Health Status on the Use of Physician Services and on Mortality in the Working-Age Population.Journal of Clinical Epidemiology, 50(5): 517-528.DOI:10.1016/S0895-4356(97)00045-0
[]Murray Christopher J.L., Lincoln C. Chen. 1992.Understanding Morbidity Change.Population and Development Review, 18(3): 481-503.DOI:10.2307/1973655
[]Murray, Christopher J. L., Ajay Tandon, Joshua A. Salomon, Colin D. Mathers, and Ritu Sadana. 2002. "New Approaches to Enhance Cross-Population Comparability of Survey Results. "In Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications, edited by Christopher J. L. Murray, Joshua A. Salomon, Colin D. Mathers, and Alan D. Lopez. World Health Organization: Geneva: 421-431.
[]Radloff Lenore Sawyer. 1977.The CES-D Scale:A Self-Report Depression Scale for Research in the General Population.Applied Psychometric Measurement, 1(3): 385-401.DOI:10.1177/014662167700100306
[]Sadana, Ritu, Colin D. Mathers, Alan D. Lopez, Christopher J. L. Murray, and Kim Moesgarrd Iburg. 2002. "Comparative Analysis of More than 50 Household Surveys on Health Status. "In Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications, edited by Christopher J. L. Murray, Joshua A. Salomon, Colin D. Mathers, and Alan D. Lopez. World Health Organization: Geneva: 370-386.
[]Salomon Joshua A., Ajay Tandon, Christopher JL Murray. 2004.Comparability of Self-Rated Health:Cross-Sectional Multi-Country Survey Using Anchoring Vignettes.British Medical Journal.
[]Sen Amartya. 2002.Health:Perception Versus Observation.British Medical Journal, 324(7342): 860-861.DOI:10.1136/bmj.324.7342.860
[]Tandon, Christopher J.L. Murray, Joshua A. Salomon, Gary King. 2002.Statistical Models for Enhancing Cross-Population Comparability.Global Programme on Evidence for Health Policy Discussion Paper, 42.
[]Thomas, Duncan and Elizabeth Frankenberg. 2002. "The Measurement and Interpretation of Health in Social Surveys. "In Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications, edited by Christopher J. L. Murray, Joshua A. Salomon, Colin D. Mathers, and Alan D. Lopez. World Health Organization: Geneva: 387-420.
[]Van Doorslaer Eddy, Gerdtham Ulf-G.. 2003.Does Inequality in Self-Assessed Health Predict Inequality in Survival by Income? Evidence form Swedish Data.Social Science & Medicine, 57(9): 1621-1629.
[]World Health Organization. 1946. WHO Definition of Health. Preamble to the Constitution of the World Health Organization as Adopted by the International Health Conference, New York, 19-22 June.
相關(guān)知識(shí)
Health consciousness and health behavior: the application of a new health consciousness scale
Development and validation of the Chinese Health Literacy Scale for Chronic Care
口腔保健自我效能量表的漢化及其在孕期女性中的信效度檢驗(yàn)
自評(píng)家庭負(fù)擔(dān)量表應(yīng)用于神經(jīng)性厭食患者家庭的信效度研究
Wellness promotion beliefs and practices of pediatric physical therapists
general health是什么意思
肥胖患者飲食行為評(píng)估量表的漢化及信效度檢驗(yàn)
The impact of weight self
Knowledge and Attitude of School Teachers towards Promoting Healthy Lifestyle to Students
Ministry of Health and Welfare, Health Service Bureau, Community Health, Health Promotion and Nutrition Division (1999) Overview of the Results of a Questionnaire on the Actual Situation of Smoking and Health Problems in FY1998.
網(wǎng)址: Reliability and Validity of Self http://m.u1s5d6.cn/newsview1133657.html
推薦資訊
- 1發(fā)朋友圈對(duì)老公徹底失望的心情 12775
- 2BMI體重指數(shù)計(jì)算公式是什么 11235
- 3補(bǔ)腎吃什么 補(bǔ)腎最佳食物推薦 11199
- 4性生活姿勢(shì)有哪些 盤(pán)點(diǎn)夫妻性 10425
- 5BMI正常值范圍一般是多少? 10137
- 6在線(xiàn)基礎(chǔ)代謝率(BMR)計(jì)算 9652
- 7一邊做飯一邊躁狂怎么辦 9138
- 8從出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7826