首頁 資訊 心理健康綜合自適應(yīng)測評方法及系統(tǒng)與流程

心理健康綜合自適應(yīng)測評方法及系統(tǒng)與流程

來源:泰然健康網(wǎng) 時間:2025年09月11日 22:35

1.本發(fā)明屬于心理測評技術(shù)領(lǐng)域,尤其涉及一種心理健康綜合自適應(yīng)測評方法及系統(tǒng)。

背景技術(shù):

2.傳統(tǒng)的心理量表測驗通常是“千人一面”式的測驗,所有學(xué)生回答相同的條目,同一個學(xué)生在多次測驗時只能答重復(fù)的條目,這導(dǎo)致了試題的有效性問題;不同被試者的心理情況不同,每一個被試者在全答的測驗方式中需要測驗一些與其能力不匹配的試題,造成時間和精力的浪費;如果該測驗條目較多,長時間的測驗會導(dǎo)致靠后部分條目測驗的可靠性降低,不能反映被試者真實的心理情況。目前丁樹良等人提出基于項目反應(yīng)理論進(jìn)行計算機(jī)自適應(yīng)測驗(cat),實現(xiàn)對被試者進(jìn)行針對化測驗,在保證測驗效果相同的基礎(chǔ)上約簡測驗條目中與被試者能力不符的條目。如何提高自適應(yīng)測驗的準(zhǔn)確度,具有很重要的科學(xué)和現(xiàn)實意義。
3.現(xiàn)有技術(shù)存在由于測驗中存在大量測驗條目與被試者能力不符,從而導(dǎo)致自適應(yīng)測驗的準(zhǔn)確度低且個性化效果欠佳的問題。

技術(shù)實現(xiàn)要素:

4.本發(fā)明提供一種心理健康綜合自適應(yīng)測評方法及系統(tǒng),以解決上述背景技術(shù)中提出現(xiàn)有技術(shù)存在由于測驗中存在大量測驗條目與被試者能力不符,從而導(dǎo)致自適應(yīng)測驗的準(zhǔn)確度低且個性化效果欠佳的問題。
5.本發(fā)明所解決的技術(shù)問題采用以下技術(shù)方案來實現(xiàn):一種心理健康綜合自適應(yīng)測評方法,包括:
6.評估當(dāng)前被試者的能力:基于等級反應(yīng)模型samejima,通過條件極大似然法評估當(dāng)前被試者的能力;
7.確定與當(dāng)前被試者的能力匹配的試題:根據(jù)當(dāng)前被試者的能力,通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題。
8.進(jìn)一步,所述評估當(dāng)前被試者的能力包括:
9.在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù),其包括探測性能力初步估計和正式測驗?zāi)芰?zhǔn)確估計;
10.所述探測性能力初步估計包括:
11.若初次未知被試者的能力值,則將題庫中每題均設(shè)為1分,并從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,并根據(jù)測驗結(jié)果通過能力初步估計函數(shù)確定能力初步估計值;
12.所述能力初步估計函數(shù)為:
[0013][0014]
所述θ0為能力初步估計值;
[0015]
所述正式測驗?zāi)芰?zhǔn)確估計包括:
[0016]
采用條件極大似然估計法逐題實時估計被試者的測驗?zāi)芰?zhǔn)確估計值,其包括:
[0017]
通過梯度下降數(shù)值分析函數(shù)計算對數(shù)似然函數(shù),預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個測驗結(jié)果計算損失函數(shù)的梯度矢量,直到測驗?zāi)芰?zhǔn)確估計值收斂到所在處的最小值,并確定測驗?zāi)芰?zhǔn)確估計值;
[0018]
所述對數(shù)似然函數(shù)為:
[0019][0020]
所述梯度下降數(shù)值分析函數(shù)包括:
[0021][0022][0023]
所述θ為測驗?zāi)芰?zhǔn)確估計值;
[0024]
所述為損失函數(shù)的梯度矢量;
[0025]
l是已答m道題得到結(jié)果為t的對數(shù)似然函數(shù),d=-1.7,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度;θ0是自變量參數(shù),η是學(xué)習(xí)因子,θ表示更新后的θ0;
[0026]
進(jìn)一步,所述梯度下降數(shù)值分析方法借助python第三方庫計算庫scipy中fsolve函數(shù)迭代估計對數(shù)似然函數(shù)并確定測驗?zāi)芰?zhǔn)確估計值θ。
[0027]
進(jìn)一步,若三道題測驗結(jié)果均為滿分,則反復(fù)隨機(jī)從題庫中隨機(jī)選擇一道題進(jìn)行測驗,直到測驗結(jié)果至少有一題不為滿分為止。
[0028]
進(jìn)一步,所述確定與當(dāng)前被試者的能力匹配的試題包括:
[0029]
確定最大信息閾值:根據(jù)樣本數(shù)據(jù)估算每個被試者的平均能力值,根據(jù)平均能力值計算相應(yīng)的每個領(lǐng)域的信息量,并將相應(yīng)的每個領(lǐng)域的信息量作為相應(yīng)的每個領(lǐng)域的最大信息閾值;
[0030]
最大信息量選題:根據(jù)當(dāng)前被試者的能力值,通過試題信息量函數(shù)計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗;
[0031]
所述試題信息量函數(shù)為:
[0032][0033]
所述p
θt
表示能力為θ的被試者在等級為f的條目恰好得到t分的概率,表示能力為θ的被試者在等級為f的條目得到t分及以上的概率,a表示該條目
的區(qū)分度,b
t
表示該條目第t等級的難度(t=1,2,,f)。
[0034]
進(jìn)一步,所述樣本數(shù)據(jù)對于條目的區(qū)分度和難度參數(shù)估計采用邊際極大似然法估計。
[0035]
進(jìn)一步,所述相應(yīng)的每個領(lǐng)域包括心理狀態(tài)領(lǐng)域、行為狀態(tài)領(lǐng)域、人際關(guān)系領(lǐng)域、情緒情感領(lǐng)域、環(huán)境適應(yīng)領(lǐng)域。
[0036]
進(jìn)一步,所述等級反應(yīng)模型samejima為:
[0037][0038][0039]
所述p
θt
為能力為θ的當(dāng)前被試者在等級為f的條目恰好得到t分的概率;
[0040]
所述為能力為θ的當(dāng)前被試者在等級為f的條目得到t分及以上的概率;
[0041]
所述a為相應(yīng)的條目的區(qū)分度;
[0042]
所述b
t
為相應(yīng)的條目第t等級的難度;
[0043]
所述等級為f的條目為4級、5級和6級。
[0044]
進(jìn)一步,其中,所述t的取值范圍為1~f;
[0045]
在等級反應(yīng)模型samejima中,各相應(yīng)的條目難度等級單調(diào)遞增,所述b
t
的單調(diào)遞增關(guān)系為:b1<b2<

<b
g-1
<b
f
。
[0046]
同時,本發(fā)明還提供一種自適應(yīng)心理健康綜合測驗問卷系統(tǒng),包括問卷系統(tǒng);
[0047]
所述問卷系統(tǒng)包括學(xué)生端應(yīng)用模塊、教師端應(yīng)用模塊、管理員端應(yīng)用模塊;
[0048]
所述學(xué)生端應(yīng)用模塊包括:學(xué)生注冊登錄子模塊、學(xué)生信息完善子模塊、學(xué)生密碼修改子模塊、學(xué)生作答結(jié)果查看子模塊以及基于上述心理健康綜合自適應(yīng)測評方法的自適應(yīng)測驗子系統(tǒng);
[0049]
所述自適應(yīng)測驗子系統(tǒng)包括測試題庫;
[0050]
所述教師端應(yīng)用模塊包括:教師注冊登錄子模塊、教師信息完善子模塊、教師密碼修改子模塊、學(xué)生管理子模塊;
[0051]
所述管理員端應(yīng)用模塊包括:管理員注冊登錄子模塊、管理員信息完善子模塊、管理員密碼修改子模塊、教師學(xué)生管理子模塊、學(xué)生作答情況分析子模塊。
[0052]
本發(fā)明的有益效果為:
[0053]
本專利采用評估當(dāng)前被試者的能力:基于等級反應(yīng)模型samejima,通過條件極大似然法評估當(dāng)前被試者的能力;確定與當(dāng)前被試者的能力匹配的試題:根據(jù)當(dāng)前被試者的能力,通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題,由于在自適應(yīng)測驗過程中,需要對被試者的能力值進(jìn)行參數(shù)估計,每測驗一道題都需要進(jìn)行一次能力估計。對于能力參數(shù)估計,基于samejima等級反應(yīng)模型,采用條件極大似然法估計被試的能力,能力評估分為兩個階段:探測性能力初步估計、正式測驗?zāi)芰?zhǔn)確估計,本方案實現(xiàn)了對被試者進(jìn)行針對化測驗,在保證測驗效果相同的基礎(chǔ)上約簡測驗條目中與被試者能力不符的條目,因此,提高自適應(yīng)測驗的準(zhǔn)確度,具有很重要的科學(xué)和現(xiàn)實意義。
附圖說明
[0054]
圖1是本發(fā)明測評方法的流程圖;
[0055]
圖2是本發(fā)明測評方法的具體流程圖;
[0056]
圖3是本發(fā)明測評方法的選題策略流程圖;
[0057]
圖4是本發(fā)明測評系統(tǒng)的結(jié)構(gòu)簡圖。
具體實施方式
[0058]
以下結(jié)合附圖對本發(fā)明做進(jìn)一步描述:
[0059]
圖中:
[0060]
s101-評估當(dāng)前被試者的能力;
[0061]
s102-確定與當(dāng)前被試者的能力匹配的試題;
[0062]
s201-基于等級反應(yīng)模型samejima;
[0063]
s202-通過條件極大似然法評估當(dāng)前被試者的能力;
[0064]
s203-根據(jù)當(dāng)前被試者的能力;
[0065]
s204-通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題。
[0066]
實施例:
[0067]
實施例一:如圖1、2、3所示,一種心理健康綜合自適應(yīng)測評方法,包括:
[0068]
評估當(dāng)前被試者的能力s101:基于等級反應(yīng)模型samejimas201,通過條件極大似然法評估當(dāng)前被試者的能力s202;
[0069]
確定與當(dāng)前被試者的能力匹配的試題s102:根據(jù)當(dāng)前被試者的能力s203,通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題s204。
[0070]
由于采用評估當(dāng)前被試者的能力:基于等級反應(yīng)模型samejima,通過條件極大似然法評估當(dāng)前被試者的能力;確定與當(dāng)前被試者的能力匹配的試題:根據(jù)當(dāng)前被試者的能力,通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題,由于在自適應(yīng)測驗過程中,需要對被試者的能力值進(jìn)行參數(shù)估計,每測驗一道題都需要進(jìn)行一次能力估計。對于能力參數(shù)估計,基于samejima等級反應(yīng)模型,采用條件極大似然法估計被試的能力,能力評估分為兩個階段:探測性能力初步估計、正式測驗?zāi)芰?zhǔn)確估計,本方案實現(xiàn)了對被試者進(jìn)行針對化測驗,在保證測驗效果相同的基礎(chǔ)上約簡測驗條目中與被試者能力不符的條目,因此,提高自適應(yīng)測驗的準(zhǔn)確度,具有很重要的科學(xué)和現(xiàn)實意義。
[0071]
2、根據(jù)權(quán)利要求1所述測評方法,其特征在于,所述評估當(dāng)前被試者的能力s101包括:
[0072]
在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù),其包括探測性能力初步估計和正式測驗?zāi)芰?zhǔn)確估計;
[0073]
所述探測性能力初步估計包括:
[0074]
若初次未知被試者的能力值,則將題庫中每題均設(shè)為1分,并從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,并根據(jù)測驗結(jié)果通過能力初步估計函數(shù)確定能力初步估計值;
[0075]
所述能力初步估計函數(shù)為:
[0076]
所述θ0為能力初步估計值;
[0077]
所述正式測驗?zāi)芰?zhǔn)確估計包括:
[0078]
采用條件極大似然估計法逐題實時估計被試者的測驗?zāi)芰?zhǔn)確估計值,其包括:
[0079]
通過梯度下降數(shù)值分析函數(shù)計算對數(shù)似然函數(shù),預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個測驗結(jié)果計算損失函數(shù)的梯度矢量,直到測驗?zāi)芰?zhǔn)確估計值收斂到所在處的最小值,并確定測驗?zāi)芰?zhǔn)確估計值;
[0080]
θ為測驗?zāi)芰?zhǔn)確估計值,l是已答m道題得到結(jié)果為t的對數(shù)似然函數(shù),d=-1.7,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度。θ0是自變量參數(shù),η是學(xué)習(xí)因子,θ表示更新后的θ0;
[0081]
所述對數(shù)似然函數(shù)為:
[0082][0083]
所述梯度下降數(shù)值分析函數(shù)包括:
[0084][0085][0086]
所述θ為測驗?zāi)芰?zhǔn)確估計值;
[0087]
所述為損失函數(shù)的梯度矢量。
[0088]
由于采用所述評估當(dāng)前被試者的能力包括:在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù),其包括探測性能力初步估計和正式測驗?zāi)芰?zhǔn)確估計;所述探測性能力初步估計包括:若初次未知被試者的能力值,則將題庫中每題均設(shè)為1分,并從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,并根據(jù)測驗結(jié)果通過能力初步估計函數(shù)確定能力初步估計值;所述正式測驗?zāi)芰?zhǔn)確估計包括:采用條件極大似然估計法逐題實時估計被試者的測驗?zāi)芰?zhǔn)確估計值,其包括:通過梯度下降數(shù)值分析函數(shù)計算對數(shù)似然函數(shù),預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個測驗結(jié)果計算損失函數(shù)的梯度矢量,直到測驗?zāi)芰?zhǔn)確估計值收斂到所在處的最小值,并確定測驗?zāi)芰?zhǔn)確估計值,由于探測性能力初步估計階段:如果開始測驗之前不知道被試者的能力值,則需要進(jìn)行探測性測驗。對于題庫中所有條目得分都為1分開始,探測性測驗首先從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,如果三道題選擇結(jié)果都為滿分,則繼續(xù)隨機(jī)從題庫中選擇一道題作答,直到所有作答結(jié)果都不為滿分,探測性測驗結(jié)束,能力初步估計值:
[0089][0090]
正式測驗階段:被試者每作答一道試題都需要根據(jù)之前作答的記錄估計當(dāng)前被試者的準(zhǔn)確能力值,能力估計采用條件極大似然估計,首先根據(jù)已答m道題的作答結(jié)果t所需
的概率形成似然函數(shù)l:
[0091][0092]
為了估計能力參數(shù)θ,只需要將似然函數(shù)l取最大值,即滿足似然函數(shù)關(guān)于能力θ的一階倒數(shù)等于0,對于似然函數(shù)是連乘,故等式兩邊取對數(shù)換成累加的形式,故估計能力θ需滿足條件:
[0093][0094][0095]
由于等式在估計過程中屬于非線性方程,求解非線性方程需要采用數(shù)值分析的方法,常用牛頓-拉夫遜迭代法,梯度相關(guān)的優(yōu)化算法。在本研究中,比較了這兩種非線性求解方法:對于牛頓-拉夫遜迭代法,計算對數(shù)似然函數(shù)對于參數(shù)θ的一階導(dǎo)數(shù)和二階導(dǎo)數(shù),在迭代過程中,當(dāng)達(dá)到精度ε時停止迭代,即迭代過程中能力值的誤差:
[0096]
θ
k+1
=θ
k-ε
[0097][0098][0099][0100]
對于梯度相關(guān)的優(yōu)化算法中梯度下降法,預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個作答記錄計算損失函數(shù)的梯度矢量,直到參數(shù)θ收斂到所在處的最小值:
[0101][0102]
表示梯度
[0103]
在本案中,若采用牛頓-拉夫遜迭代法,如果第一次迭代時誤差項較大,則θ變化大,就會導(dǎo)致之后的誤差項更大,最后,輸出奇異值。若采用梯度下降法,借助python第三方庫計算庫scipy中fsolve函數(shù)求解非線性方程,其原理則采用梯度下降法進(jìn)行迭代估計參數(shù)θ,使用兩種方法進(jìn)行測驗比較,梯度下降法效果明顯好于牛頓-拉夫遜迭代法。故能力參數(shù)估計采用梯度下降法。
[0104]
同時,為了自適應(yīng)測驗方法的實現(xiàn),其特征在于參數(shù)估計和選題策略,所述方法包括:
[0105]
參數(shù)估計包含條目的區(qū)分度和難度參數(shù)估計,以及被試者的能力(特質(zhì)水平)參數(shù)估計。由于條目的等級為4級、5級和6級,因此在參數(shù)估計時采用samejima等級反應(yīng)模型:
[0106][0107][0108]
式中p
θt
表示能力為θ的被試者在等級為f的條目恰好得到t分的概率,表示能力為θ的被試者在等級為f的條目得到t分及以上的概率,d=-1.7,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度(t=1,2,,f)。在等級反應(yīng)模型中,各條目難度等級單調(diào)遞增,即b1<b2<

<b
f-1
<b
f
。在自適應(yīng)測驗前,樣本數(shù)據(jù)對于條目的區(qū)分度和難度參數(shù)估計采用邊際極大似然法估計。在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù)。
[0109]
本案給出一個基于最大信息量的改進(jìn)選題策略,即最大信息量-最大信息閾值選題策略:在題庫中每個領(lǐng)域中,根據(jù)樣本數(shù)據(jù)估計每個被試的能力值并取平均值,根據(jù)平均能力值計算每個領(lǐng)域的信息量。將每個領(lǐng)域的信息量作為各部分的測驗總信息量,即最大信息閾值。在測驗過程中,根據(jù)當(dāng)前被試者的能力值,計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗。
[0110]
3、根據(jù)權(quán)利要求2所述測評方法,其特征在于,所述梯度下降數(shù)值分析方法借助python第三方庫計算庫scipy中fsolve函數(shù)迭代估計對數(shù)似然函數(shù)并確定測驗?zāi)芰?zhǔn)確估計值θ。
[0111]
由于采用所述梯度下降數(shù)值分析方法借助python第三方庫計算庫scipy中fsolve函數(shù)迭代估計對數(shù)似然函數(shù)并確定測驗?zāi)芰?zhǔn)確估計值θ,由于在本案中,若采用牛頓-拉夫遜迭代法,如果第一次迭代時誤差項較大,則θ變化大,就會導(dǎo)致之后的誤差項更大,最后,輸出奇異值。若采用梯度下降法,借助python第三方庫計算庫scipy中fsolve函數(shù)求解非線性方程,其原理則采用梯度下降法進(jìn)行迭代估計參數(shù)θ,使用兩種方法進(jìn)行測驗比較,梯度下降法效果明顯好于牛頓-拉夫遜迭代法。故能力參數(shù)估計采用梯度下降法。
[0112]
4、根據(jù)權(quán)利要求2所述測評方法,其特征在于,若三道題測驗結(jié)果均為滿分,則反復(fù)隨機(jī)從題庫中隨機(jī)選擇一道題進(jìn)行測驗,直到測驗結(jié)果至少有一題不為滿分為止。
[0113]
由于采用若三道題測驗結(jié)果均為滿分,則反復(fù)隨機(jī)從題庫中隨機(jī)選擇一道題進(jìn)行測驗,直到測驗結(jié)果至少有一題不為滿分為止,由于探測性測驗首先從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,如果三道題選擇結(jié)果都為滿分,則繼續(xù)隨機(jī)從題庫中選擇一道題作答,直到所有作答結(jié)果都不為滿分,探測性測驗結(jié)束,由于采用探測性測驗,能夠快速得出能力初步估計值,并根據(jù)初步估計值對被測試者進(jìn)行下一階段針對性的測試。
[0114]
5、根據(jù)權(quán)利要求1所述測評方法,其特征在于,所述確定與當(dāng)前被試者的能力匹配的試題s102包括:
[0115]
確定最大信息閾值:根據(jù)樣本數(shù)據(jù)估算每個被試者的平均能力值,根據(jù)平均能力值計算相應(yīng)的每個領(lǐng)域的信息量,并將相應(yīng)的每個領(lǐng)域的信息量作為相應(yīng)的每個領(lǐng)域的最
大信息閾值;
[0116]
最大信息量選題:根據(jù)當(dāng)前被試者的能力s203值,通過試題信息量函數(shù)計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗;
[0117]
所述試題信息量函數(shù)為:
[0118][0119]
所述p
θt
表示能力為θ的被試者在等級為f的條目恰好得到t分的概率,表示能力為θ的被試者在等級為f的條目得到t分及以上的概率,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度(t=1,2,,f)。
[0120]
由于采用所述確定與當(dāng)前被試者的能力匹配的試題包括:確定最大信息閾值:根據(jù)樣本數(shù)據(jù)估算每個被試者的平均能力值,根據(jù)平均能力值計算相應(yīng)的每個領(lǐng)域的信息量,并將相應(yīng)的每個領(lǐng)域的信息量作為相應(yīng)的每個領(lǐng)域的最大信息閾值;最大信息量選題:根據(jù)當(dāng)前被試者的能力值,通過試題信息量函數(shù)計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗;由于最大信息量-最大信息閾值選題策略包括自適應(yīng)測驗中使用最為廣泛的選題策略有最大信息量選題策略和a分層法選題策略。最大信息量選題策略固定測驗總長度,基于當(dāng)前能力值計算剩余試題的信息量:
[0121]
并從中選擇信息量最大的試題,每測驗完一道試題都需要進(jìn)行一次能力估計,直到達(dá)到測驗總長度停止測驗,由于信息量不僅受被試者能力的影響,也受試題本身區(qū)分度、難度參數(shù)的影響,因此在某些試題上信息量較大,故在測驗過程中經(jīng)常出現(xiàn),而有些試題信息量較小,在測驗過程中很少出現(xiàn),這導(dǎo)致了曝光率的問題。a分層法基于最大信息量選題策略曝光率問題提出的一種選題策略,根據(jù)試題的區(qū)分度參數(shù)將試題分為k層,被試者從第一層開始測驗,在每一層中根據(jù)被試者的當(dāng)前能力值θ選擇試題中難度中位數(shù)與能力最匹配的試題作為下一道作答試題。即:,作答結(jié)束后計算該題的信息量,再估計當(dāng)前被試者的能力值,累加信息量,當(dāng)達(dá)到每一層信息量閾值時進(jìn)入下一層選題,直到達(dá)到測驗總信息量停止。在a分層選題策略中,需要解決兩個問題:1、確定層數(shù)k;2、確定測驗總信息量。
[0122]
確定層數(shù)k:需要考慮幾個因素。第一是題庫中區(qū)分度(a)的分布情況,如果題庫中具有相似區(qū)分度的條目組成,則分層的影響最小化,因此需要很少的層數(shù)。反之則需要大量的層數(shù)。第二是題庫的豐富程度,指難度(b)的范圍與預(yù)期的范圍相匹配的程度,更豐富的題庫可以分得層數(shù)更多。
[0123]
確定測驗總信息量:測驗總信息量和最大信息信息量選題策略中固定測驗長度的用途一致,用于控制測驗的長度,這其實也是一個探測性/經(jīng)驗性的決定,并沒有一個明確的方法用于確定其值。
[0124]
故本案提出了一種基于最大信息量選題策略的改進(jìn)選題策略,即最大信息量-最大信息閾值的選題策略。在題庫中每個領(lǐng)域中:
[0125]
1、根據(jù)樣本數(shù)據(jù)估計每個被試的能力值并取平均值,根據(jù)平均能力值計算每個領(lǐng)
域的信息量。將每個領(lǐng)域的信息量作為各部分的測驗總信息量,即最大信息閾值;
[0126]
2、對于選題則采用最大信息量的方法,根據(jù)當(dāng)前被試者的能力值,計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗。
[0127]
此選題策略在使測驗總信息量與未采用選題策略時測驗的總信息量一致,保證測驗的效果。同時避免了一般最大信息量選題策略時確定測驗長度不準(zhǔn)確帶來的影響,一定程度上降低了項目曝光率的問題。
[0128]
所述樣本數(shù)據(jù)對于條目的區(qū)分度和難度參數(shù)估計采用邊際極大似然法估計。
[0129]
由于采用所述相應(yīng)的每個領(lǐng)域包括心理狀態(tài)領(lǐng)域、行為狀態(tài)領(lǐng)域、人際關(guān)系領(lǐng)域、情緒情感領(lǐng)域、環(huán)境適應(yīng)領(lǐng)域,每個領(lǐng)域的信息量作為各部分的測驗總信息量,即最大信息閾值的值如下表所示:
[0130]
組別心理狀態(tài)領(lǐng)域行為狀態(tài)領(lǐng)域人際關(guān)系領(lǐng)域情緒情感領(lǐng)域環(huán)境適應(yīng)領(lǐng)域小學(xué)22.69713.32940.28610.27187.199中學(xué)60.337102.01635.20245.43113.927
[0131]
所述相應(yīng)的每個領(lǐng)域包括心理狀態(tài)領(lǐng)域、行為狀態(tài)領(lǐng)域、人際關(guān)系領(lǐng)域、情緒情感領(lǐng)域、環(huán)境適應(yīng)領(lǐng)域。
[0132]
所述等級反應(yīng)模型samejima為:
[0133][0134][0135]
所述p
θt
為能力為θ的當(dāng)前被試者在等級為f的條目恰好得到t分的概率;
[0136]
所述為能力為θ的當(dāng)前被試者在等級為f的條目得到t分及以上的概率;
[0137]
所述a為相應(yīng)的條目的區(qū)分度;
[0138]
所述b
t
為相應(yīng)的條目第t等級的難度;
[0139]
所述等級為f的條目為4級、5級和6級。
[0140]
其中,所述t的取值范圍為1~f;
[0141]
在等級反應(yīng)模型samejima中,各相應(yīng)的條目難度等級單調(diào)遞增,所述b
t
的單調(diào)遞增關(guān)系為:b1<b2<

<b
f-1
<b
f

[0142]
由于采用基于等級反應(yīng)模型samejima,其中,所述t的取值范圍為1~f;在等級反應(yīng)模型samejima中,各相應(yīng)的條目難度等級單調(diào)遞增,所述b
t
的單調(diào)遞增關(guān)系為:
[0143]
b1<b2<...<b
f-1
<b
f
[0144]
由于參數(shù)估計包含條目的區(qū)分度和難度參數(shù)估計,以及被試者的能力(特質(zhì)水平)參數(shù)估計。由于條目的等級為4級、5級和6級,因此在參數(shù)估計時采用samejima等級反應(yīng)模型:
[0145]
[0146][0147]
式中p
θt
表示能力為θ的被試者在等級為f的條目恰好得到t分的概率,表示能力為θ的被試者在等級為f的條目得到t分及以上的概率,d=-1.7,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度(t=1,2,..,f),在等級反應(yīng)模型中,各條目難度等級單調(diào)遞增,即b1<b2<

<b
f-1
<b
f
。在自適應(yīng)測驗前,樣本數(shù)據(jù)對于條目的區(qū)分度和難度參數(shù)估計采用邊際極大似然法估計。在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù)。
[0148]
如圖4所示,本發(fā)明提供了一種自適應(yīng)心理健康綜合測驗問卷系統(tǒng),包括問卷系統(tǒng);
[0149]
所述問卷系統(tǒng)包括學(xué)生端應(yīng)用模塊、教師端應(yīng)用模塊、管理員端應(yīng)用模塊;
[0150]
所述學(xué)生端應(yīng)用模塊包括:學(xué)生注冊登錄子模塊、學(xué)生信息完善子模塊、學(xué)生密碼修改子模塊、學(xué)生作答結(jié)果查看子模塊以及基于上述自適應(yīng)心理健康綜合測評方法應(yīng)用的自適應(yīng)測驗子系統(tǒng);
[0151]
所述自適應(yīng)測驗子系統(tǒng)包括測試題庫;
[0152]
所述教師端應(yīng)用模塊包括:教師注冊登錄子模塊、教師信息完善子模塊、教師密碼修改子模塊、學(xué)生管理子模塊;
[0153]
所述管理員端應(yīng)用模塊包括:管理員注冊登錄子模塊、管理員信息完善子模塊、管理員密碼修改子模塊、教師學(xué)生管理子模塊、學(xué)生作答情況分析子模塊。
[0154]
同時,本發(fā)明提供一種自適應(yīng)心理健康綜合測驗問卷系統(tǒng),包括問卷系統(tǒng);所述問卷系統(tǒng)包括學(xué)生端應(yīng)用模塊、教師端應(yīng)用模塊、管理員端應(yīng)用模塊;所述學(xué)生端應(yīng)用模塊包括:學(xué)生注冊登錄子模塊、學(xué)生信息完善子模塊、學(xué)生密碼修改子模塊、學(xué)生作答結(jié)果查看子模塊以及基于如上述自適應(yīng)心理健康綜合測評方法應(yīng)用的自適應(yīng)測驗子系統(tǒng);所述自適應(yīng)測驗子系統(tǒng)包括測試題庫;所述教師端應(yīng)用模塊包括:教師注冊登錄子模塊、教師信息完善子模塊、教師密碼修改子模塊、學(xué)生管理子模塊;所述管理員端應(yīng)用模塊包括:管理員注冊登錄子模塊、管理員信息完善子模塊、管理員密碼修改子模塊、教師學(xué)生管理子模塊、學(xué)生作答情況分析子模塊,由于該問卷系統(tǒng)以學(xué)校為單位,針對學(xué)校管理員、學(xué)校老師、學(xué)校學(xué)生等三種身份設(shè)計相關(guān)的功能,學(xué)校管理者能夠管理該校的學(xué)生并定期開展心理測驗,查看學(xué)生的測驗結(jié)果;基于項目反映理論,測驗學(xué)生從心理狀態(tài)、行為狀態(tài)、情緒情感、人際關(guān)系、環(huán)境適應(yīng)等五個領(lǐng)域進(jìn)行能力評估,根據(jù)學(xué)生的作答情況提供自適應(yīng)的選題策略,實現(xiàn)智能組卷,因人而異、因時而異的自適應(yīng)測驗;該系統(tǒng)在保證測試效果的基礎(chǔ)上約簡與被試者能力不同的試題。
[0155]
工作原理:
[0156]
本專利通過評估當(dāng)前被試者的能力:基于等級反應(yīng)模型samejima,通過條件極大似然法評估當(dāng)前被試者的能力;確定與當(dāng)前被試者的能力匹配的試題:根據(jù)當(dāng)前被試者的能力,通過最大信息量與最大信息閾值的相融合的選題策略自適應(yīng)地選擇與當(dāng)前被試者的能力匹配的試題,由于在自適應(yīng)測驗過程中,需要對被試者的能力值進(jìn)行參數(shù)估計,每測驗一道題都需要進(jìn)行一次能力估計。對于能力參數(shù)估計,基于samejima等級反應(yīng)模型,采用條
件極大似然法估計被試的能力,能力評估分為兩個階段:探測性能力初步估計、正式測驗?zāi)芰?zhǔn)確估計,所述評估當(dāng)前被試者的能力包括:在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù),其包括探測性能力初步估計和正式測驗?zāi)芰?zhǔn)確估計;所述探測性能力初步估計包括:若初次未知被試者的能力值,則將題庫中每題均設(shè)為1分,并從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,并根據(jù)測驗結(jié)果通過能力初步估計函數(shù)確定能力初步估計值;所述正式測驗?zāi)芰?zhǔn)確估計包括:采用條件極大似然估計法逐題實時估計被試者的測驗?zāi)芰?zhǔn)確估計值,其包括:通過梯度下降數(shù)值分析函數(shù)計算對數(shù)似然函數(shù),預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個測驗結(jié)果計算損失函數(shù)的梯度矢量,直到測驗?zāi)芰?zhǔn)確估計值收斂到所在處的最小值,并確定測驗?zāi)芰?zhǔn)確估計值,由于探測性能力初步估計階段:如果開始測驗之前不知道被試者的能力值,則需要進(jìn)行探測性測驗。對于題庫中所有條目得分都為1分開始,探測性測驗首先從題庫中隨機(jī)選擇三道不重復(fù)的試題進(jìn)行測驗,如果三道題選擇結(jié)果都為滿分,則繼續(xù)隨機(jī)從題庫中選擇一道題作答,直到所有作答結(jié)果都不為滿分,探測性測驗結(jié)束,能力初步估計值:
[0157][0158]
正式測驗階段:被試者每作答一道試題都需要根據(jù)之前作答的記錄估計當(dāng)前被試者的準(zhǔn)確能力值,能力估計采用條件極大似然估計,首先根據(jù)已答m道題的作答結(jié)果t所需的概率形成似然函數(shù)l:
[0159][0160]
為了估計能力參數(shù)θ,只需要將似然函數(shù)l取最大值,即滿足似然函數(shù)關(guān)于能力θ的一階倒數(shù)等于0,對于似然函數(shù)是連乘,故等式兩邊取對數(shù)換成累加的形式,故估計能力θ需滿足條件:
[0161][0162][0163]
由于等式在估計過程中屬于非線性方程,求解非線性方程需要采用數(shù)值分析的方法,常用牛頓-拉夫遜迭代法,梯度相關(guān)的優(yōu)化算法。在本研究中,比較了這兩種非線性求解方法:對于牛頓-拉夫遜迭代法,計算對數(shù)似然函數(shù)對于參數(shù)θ的一階導(dǎo)數(shù)和二階導(dǎo)數(shù),在迭代過程中,當(dāng)達(dá)到精度ε時停止迭代,即迭代過程中能力值的誤差:
[0164]
θ
k+1
=θ
k-ε
[0165]
[0166][0167][0168]
對于梯度相關(guān)的優(yōu)化算法中梯度下降法,預(yù)先設(shè)定好訓(xùn)練迭代次數(shù),對整個作答記錄計算損失函數(shù)的梯度矢量,直到參數(shù)θ收斂到所在處的最小值:
[0169][0170]
表示梯度
[0171]
在本案中,若采用牛頓-拉夫遜迭代法,如果第一次迭代時誤差項較大,則θ變化大,就會導(dǎo)致之后的誤差項更大,最后,輸出奇異值。若采用梯度下降法,借助python第三方庫計算庫scipy中fsolve函數(shù)求解非線性方程,其原理則采用梯度下降法進(jìn)行迭代估計參數(shù)θ,使用兩種方法進(jìn)行測驗比較,梯度下降法效果明顯好于牛頓-拉夫遜迭代法。故能力參數(shù)估計采用梯度下降法。
[0172]
同時,為了自適應(yīng)測驗方法的實現(xiàn),其特征在于參數(shù)估計和選題策略,所述方法包括:
[0173]
參數(shù)估計包含條目的區(qū)分度和難度參數(shù)估計,以及被試者的能力(特質(zhì)水平)參數(shù)估計。由于條目的等級為4級、5級和6級,因此在參數(shù)估計時采用samejima等級反應(yīng)模型:
[0174][0175][0176]
式中p
θt
表示能力為θ的被試者在等級為f的條目恰好得到t分的概率,表示能力為θ的被試者在等級為f的條目得到t分及以上的概率,d=-1.7,a表示該條目的區(qū)分度,b
t
表示該條目第t等級的難度(t=1,2,,f)。在等級反應(yīng)模型中,各條目難度等級單調(diào)遞增,即b1<b2<

<b
f-1
<b
f
。在自適應(yīng)測驗前,樣本數(shù)據(jù)對于條目的區(qū)分度和難度參數(shù)估計采用邊際極大似然法估計。在自適應(yīng)測驗過程中,根據(jù)被試者作答情況采用條件極大似然估計法估計被試者的能力參數(shù)。
[0177]
本案給出一個基于最大信息量的改進(jìn)選題策略,即最大信息量-最大信息閾值選題策略:在題庫中每個領(lǐng)域中,根據(jù)樣本數(shù)據(jù)估計每個被試的能力值并取平均值,根據(jù)平均能力值計算每個領(lǐng)域的信息量。將每個領(lǐng)域的信息量作為各部分的測驗總信息量,即最大信息閾值。在測驗過程中,根據(jù)當(dāng)前被試者的能力值,計算當(dāng)前每道題對于當(dāng)前被試者能力所能提供的信息量,選擇具有最大信息量的試題,并將信息量進(jìn)行累加,若達(dá)到最大信息閾值則停止當(dāng)前領(lǐng)域的測驗。
[0178]
本發(fā)明解決了現(xiàn)有技術(shù)存在由于測驗中存在大量測驗條目與被試者能力不符,從
而導(dǎo)致自適應(yīng)測驗的準(zhǔn)確度低且個性化效果欠佳的問題,具有實現(xiàn)了對被試者進(jìn)行針對化測驗,在保證測驗效果相同的基礎(chǔ)上約簡測驗條目中與被試者能力不符的條目,因此,提高自適應(yīng)測驗的準(zhǔn)確度,具有很重要的科學(xué)和現(xiàn)實意義的有益技術(shù)效果。
[0179]
利用本發(fā)明的技術(shù)方案,或本領(lǐng)域的技術(shù)人員在本發(fā)明技術(shù)方案的啟發(fā)下,設(shè)計出類似的技術(shù)方案,而達(dá)到上述技術(shù)效果的,均是落入本發(fā)明的保護(hù)范圍。

相關(guān)知識

心理測評綜合管理系統(tǒng)
遠(yuǎn)程健康醫(yī)療監(jiān)測方法及系統(tǒng)與流程
綜合測評心理健康怎么寫,心理健康測評系統(tǒng)
兒童心理健康測評系統(tǒng)靠譜嗎?綜合心理健康評估的重要性及應(yīng)用
健康評估系統(tǒng)及方法與流程
一種健康監(jiān)測系統(tǒng)及方法與流程
電池健康狀態(tài)檢測系統(tǒng)及方法與流程
心理健康測評系統(tǒng)
健康檢測系統(tǒng)以及健康檢測系統(tǒng)的檢測流程
電池老化狀態(tài)檢測系統(tǒng)、方法及裝置與流程

網(wǎng)址: 心理健康綜合自適應(yīng)測評方法及系統(tǒng)與流程 http://m.u1s5d6.cn/newsview1790188.html

推薦資訊