- · 《中国教育学刊》栏目设[06/29]
- · 《中国教育学刊》数据库[06/29]
- · 《中国教育学刊》收稿方[06/29]
- · 《中国教育学刊》投稿方[06/29]
- · 《中国教育学刊》征稿要[06/29]
- · 《中国教育学刊》刊物宗[06/29]
项目反应理论的Parscale软件实现*
作者:网站采编关键词:
摘要:项目反应理论(item response theory,IRT)也称条目反应理论,广泛用于教育学、心理学及医学量表测验中。Parscale软件是实现IRT理论的常用软件,由Eiji Muraki 和Darrell Bock等开发,现在由Scient
项目反应理论(item response theory,IRT)也称条目反应理论,广泛用于教育学、心理学及医学量表测验中。Parscale软件是实现IRT理论的常用软件,由Eiji Muraki 和Darrell Bock等开发,现在由Scientific Software International(SSI)公司拥有( 模型,Samejima模型(graded response model),Master部分评分模型(partial credit model),广义部分评分模型(generalized partial credit model),多项选择项目分析,多组多分类项目反应模型(multiple-group polytomous item response models)。Parscale软件还可以对量表进行项目功能差异(differential item functioning,DIF)分析。
目前,Parscale软件广泛用于心理量表的评价[1-3],教育学的评价,生存质量量表的研发和分析[6-9]。例如Castro等使用Parscale软件评价Beck抑郁问卷,研究发现Beck抑郁问卷中,患者最严重的条目是减肥、自杀的想法和社会退出[1]。Kopec等使用Parscale软件评价关节炎患者生存质量量表,从218个条目中筛选出不存在DIF的31个条目,构成5个领域。Fukuhara等使用Parscale软件研制视觉功能问卷的简短版,将原来的32个条目简化为11个条目[8]。本文结合多分类条目介绍如何使用Parscale软件。
资 料
分析资料为鼻咽癌患者生存质量量表的生理领域,一共包括9个条目,都是五分类的正向条目,得分越高说明生存质量越大。资料保存为dat格式,命名为NPC.DAT。一共15列,前面3列是ID,中间3列是空格,后面9列是条目得分。使用Samejima模型计算各个条目的参数,并估计患者的能力参数。
分析步骤
语法
本文使用的Parscale软件是4.1版本。打开Parscale软件。点击“File…New”,建立分析的文件,文件命名为Pars.PSL。 Parscale的语法都以“>”开始。在Pars.PSL中输入以下语法:
>FILE DFNAME=′NPC.DAT′,SAVE;
>SAVE PARM=′NPC.PAR′,SCORE=′NPC.SCO′;
>INPUT NIDW=3,NTOTAL=9,NTEST=1,LENGTH=(9),NFMT=1;
(3A1,3X,9A1)
>TEST1 TNAME=SCALE1,ITEM=(1(1)9),NBLOCK=1;
>BLOCK1 BNAME=SBLOCK1,NITEMS=9,NCAT=4,CADJUST=0.0;
>CALIB GRADED,LOGISTIC,SCALE=1.7,NQPTS=30,CYCLES=(25,2,2,2,2),NEWTON=5,CRIT=0.005,ITEMFIT=10;
>SCORE EAP,NQPT=30,SMEAN=0.0,SSD=1.0,NAME=EAP,PFQ=5;
2.语法说明
FILES语句,用于读取数据。DFNAME=NPC.DAT表示读取NPC.DAT 的数据,要求数据和语法文件放在同一个文件夹。SAVE表示保存语法。
SAVE语句,用于保存结果。PARM=′NPC.PAR′,表示保存条目参数(包括名字和文件扩展名);SCORE= NPC.SCO,表示保存患者的能力参数(得分)。
INPUT语句,说明分析数据的属性。NIDW表示患者的ID数量;NTOTAL表示分析的总条目数;NTEST表示量表(测试)的数量;LENGTH表示每个量表的条目数;NFMT表示读取原始记录的行数。另外TAKE = n表示选取前面n个测试者进行分析;MGROUP/MRATER说明亚组(或评价者)的数目,用于DIF分析;WEIGHT表示加权。
(3A1,3X,9A1) 语句,是变量格式语句,说明数据的存储格式,前3列是ID,其次3列是属性,最后9列是分析的条目。
TEST1语句,是测试命令语法,用于说明分析的条目数,测试的名字,定义阈值参数和区分度的初始值等。TNAME 表示测试量表的名字;INAME表示条目的列表;NBLOCK表示有相同分类参数(区组)条目的数量。另外,ITEMS表示估计的条目;INTERCEPT、THRESHOLD和SLOPE分别设定条目截距、阈值参数和区分度的初始值,经常采用默认值。
BLOCK1语句,说明每个区组的属性,Parscale软件把具有相同分类数目的条目放在一起估计。BNAME表示区组的名字;NITEMS表示每个区组包含的条目;NCAT表示每个条目的分类数目(条目的分类,本例是四分类);CADJUST对区组参数的均数进行调整。另外,GPARM设定猜测参数,RATER用于提供评价者的方差比例;REPEAT表示BLOCK语法的重复次数;SCORING表示指定计分函数。ORIGINAL表示条目的初始得分,MODIFIED表示对条目重新赋分。例如将1、2得分转化为2、1,使用ORIGINAL=(1,2),MODIFIED=(2,1)。
CALIB语句,说明估计所采用的方法。GRADED/PARTIAL表示采用Samejima模型(GRM)或者Master模型(partial credit model)对参数进行估计;LOGISTIC/NORMAL说明要使用的响应函数;SCALE表示尺度常数,设定为1.7;NQPTS表示积分点的数目;CYCLE完成EM估计的最大次数;NEWTON表示Gauss-Newton迭代的最大次数;CRIT为EM估计和Gauss-Newton迭代的收敛标准;ITEMFIT说明用于计算条目拟合统计的次数。>SCORE EAP,NQPTS=30,SMEAN=0.0,SSD=1.0,NAME=EAP,PFQ=5;
SCORE语句,说明评分过程,用于估计被测试者的得分。EAP/MLE/WML为估计的方法,EAP、ML和WML分别表示Bayes后验估计、最大似然估计和加权最大似然估计方法;NQPT为积分点的数目;SMEAN为测试的平均值;SSD为测试的标准差;NAME为估计文件的名字;PFQ说明移动到临近分类的百分比;DIST说明先验分布类型。
文章来源:《中国教育学刊》 网址: http://www.zgjyxkzz.cn/qikandaodu/2021/0216/594.html
上一篇:攻克文言文难关初探
下一篇:探生活之源 寻语文之趣