参数估计中N-R迭代算法分析与实现
2023-04-25
来源:六九路网
2010年第6期 福建电脑 67 参数估计中N—R迭代算法分析与实现 李华群1,2 (I、南昌大学信工学院江西南昌330031 2、赣南师范学院科技学院江西赣州341000) 【摘要】:本文介绍了项目反应理论的基础知识,在IRT理论下,实现了逻辑斯帝模型(单参数情况)较好的估计项目 难度d和能力参数。在进行估计时,采用极大似然法进行估计,用牛顿一拉夫森迭代法(N—R)进行求解,给出了N—R算法步 骤。最后,采用数据测试算法,求出项目难度和能力参数。 【关键词】:IRT逻辑斯蒂模型极大似然法N—R难度参数能力参数 l、项目反应理论背景及介绍 数目 项目反应理论是新近发展起来的一种先进测试理论.基于 。m:表示迭代的次数。 这一理论的测试模型称为IRT模型。IRT模型是一种数学模型, 它的特点是以概率来解释应试者对试题的反应和其潜在能力特 辜 = 为射个被试者的得分 攀“ 为第 个项目的得 质之间的关系 项目反应理论不下20余种.可根据实际情况选 分 择适当的模型 然后,采用极大似然法,对于A计算一阶和二阶偏导数,得 IRT还在测试方法上有新的突破,1种新的测试形式:计算 到: 机自适应测试正是在此基础上得以实现的。 2、逻辑斯谛模型介绍 逻辑斯谛模型包括单参数、双参数和三参数模型。在这一些 苦 ㈥ 誉=一 )㈤ 模型中.只有单参数模型(拉希模型)可以采用手工方式进行参 数估计.其他模型只能借助计算机进行处理。目前最常用的参数 m估计方法是各种极大似然法.其次是贝叶斯方法。所有这些方法 嚣=- N:㈤ 筹=一 N Ⅳ∑, )㈦ 都是以被试对于项目反应的得分情况作为参数估计基础的.因 此首先应该对被试的得分分布进行分析 以上四个表达式中. 单参数模式特征函数:P(0)=l/ +eD(O ’): 双参数模式特征函数:P(O)=1/ +e ) ::exp(Ol-b;)/[1+e 一 )]¨∑ 三参数模式特征函数:P(0)=c+0一cy +e 为了解出上述方程,我们将被试按照其得分分组,于是,得 其中:D=1.702。为一常数; 分为r的被试答对项目 的概率 为: O为被试能力值(其值有正负之分,一般取值:-4<O<4:a为题 e =∞qp( 一 )/【1+exp(o,一 )】 (7) 目的区分度。即特征曲线的斜率.它的值越大说明题目对受测者 的区分度越高。 由此而得到: b为题目的难度,即特征曲线在横坐标轴上的投影。 c为题目的猜测系数,即特征曲线的截距,其值越大,说昵不 4、N—R迭代算法实现 论受测者能力高低。都容易猜对本道题目。 通过以下的步骤可以将项目参数d;和被试能力0 估计出来: P(O)指能力为0的人答对此题目的概率.其数值介于0与l之 间。一般题目的P值建议以0.2-0.8为宜。 0 的初始值为:O=ln J....,L-1) L-r 根据上面所给出的三种参数特征函数,可以进行判断,改进 di的初始值如下式所示,并使其平均d , 等功能的选择.以便更精确的确定所要估计的参数估计.以达到 更精确的目的 d(O)=ln(N -s ̄ … 3、N—R迭代算法分析 单参数模型又称拉希模型是关于被试i对于项目i作为反应u 算法实现流程图如下: 的概率模型.它可以写作 P( I ,岛)=exp[uu( 一岛)]/[1+exp( 一岛)](1) 项目难度参数 被试能力参数估计 山 反应数据矩阵((U ))的似然函数A为: 广.r t 1 .. A=expI 一 )I/孛孛[一+e ( -bi)] Ⅳ c Ⅳ £ 一 (2) OA=InA=∑ 一∑ 一∑∑lrII 1+eXp 一 )l 其中, :被试萄的能力参数 bi:项目 难度参数 :若为J,则被试者答对项目,若为D,则被试者答错项目 s :表示第 个项目的得分 :表示得分为r的被试能力估计 值 :表示第 个项目的难度估计值 :表示得分为r的被试 (下转第99页) 2010年第6期 福建电脑 0 学生综合考评中德育.体育部分的评价本身是一个主观的 对评价指标C 打出 ,级别分数的人数 判断.评议者在打分时容易收到主观因素的影响。易出现对不同 ‘ ,=— —・——--——————-—・・—・—・・--——— 。。‘。。。 。。‘。 。。——‘‘—‘‘。‘。‘— — ——一 参与打分的总人数 学生在使用同一评价指标评分时权重不同的情况。让评议者根 e得出统计评议者的评价得出模糊评价矩阵为 据感觉对模糊的评价项目做出精确的判定分值并不合理。文中 0 8 O 2 0 0 采用多位评议者共同确定各项评价指标的权值.得到一个由各 O 9 O 1 0 0 指标权值组成的向量。评议者打分中只需做定性的描述,对这些 0 0 6 O 3 0.1 描述进行统计构建出一个选手的模糊评价矩阵.再将评价矩阵 O 0.8 0.2 0 与指标向量做模糊乘运算得到选手的模糊评价子向量。用子向 O 9 0.1 0 0 O O 0.7 0 3 量乘以评判级别的分值的到选手的成绩.此时也就完成了将评 0 O.2 0 7 0 l 议者主观判定转化为客观分值。实验证明。本文所用方法能将评 模糊子向量Ot为:a=W・T=『0.2293 0.200 0.1628 0.1399 0 议者做出的定性描述合理的转换为定量的分值.且该分值更为 o],做归一化处理后得到模糊评价子向量B为: 客观,真实。 13=[o.3133 O.2732 0.2240 0.1911 0 o], 参考文献: s=13・k 【1】1姜启源.谢金星.叶傻.数学模型【M】.北京:高等教育出版社.2009- ̄F =(0_3133x954-0.2732x85+0.2240x75+0.1911×7O+O×6O+0×50) 第3版. =83.1625 【21王立新.王迎军.模糊系统与模糊控制教程[M】.北京:清华大学出版 该学生的体育德育综合得分为83分。设智育部分的得分为 社.2003年6月第1版. 75.分值权重为O.7.其他项目的综合得分权重为0.3,则该生的最 【3】冯梅.模糊综合评价模型在教师评价中的应用Ⅱ】.北京:数学的实践 后得分为T:R× .+S×ll,1=75x0.7+83x0.3=77.4。则该学生综合考 与认识,2004,34(11):35-38. 评后的总成绩为77.4分 【4]张永梅.崭雁霞.董永华.大学生创新能力评价系统的实现Ⅱ].南昌: 3.结语 计算机与现代化,2008,I:121-123.126. (上接第59页) (1)iava只支持单继承,不允许多重继承。在JAVA中,一 的实例对象时.系统默认调用父类无参数的构造方法。 个子类只能有一个父类.不允许一个子类有多个父类。 (5)当一个子类对象的引用被赋给一个超类引用变量时,你 (2)可以有多层继承,即一个类可以继承某一个类的子类, 只能访问超类定义的对象的那一部分。因为超类不知道子类增 如类B继承了类A.类C又可以继承类B.那么类C也间接继承 加的属性。 了类A。如下所示:class Af1;class B extends A class C,extends B{}。 参考文献: (3)子类继承父类所有的成员变量和成员方法,但不继承父 【1】张岚,张志伟.浅谈面向对象的程序设计o】内蒙古科技与经济,2009 类的构造方法。在子类的构造方法中可以使用语句super(参数 (05). 列表)调用父类的构造方法。当子类覆盖父类的方法后要想调用 [2]刘少英,革俊.Java中重栽和重写的动态绑定研究o】软件导刊,2009 父类的方法用super.getXXX(…1:的形式。 (O7) (4)如果子类的构造方法中没有显式地调用父类构造方法, [3]曾崇杰.面向对象抽象思维与java继承机制仞福建电脑2008.(O4) 也没有用this关键字调用重载的其他构造方法.则在产生子类 (上接第67页) 通常.经过3 ̄4个循环既可达到这一要求。 2、侯书红.基于IRT参数估计的两种初始估计科技信息。2007年 运用此模型可对模型进行参数估计.获得精确的参数估计 项目难度参数: 项目能力参数: 值。 序号 项目名称 项目难度 采用赖特1979年《最佳测验设计》中的(35个被试对于18个 能力估计 l 3 —4.18fi 项目的反应数据》中的数据测试,我用C语言编制了该方法的程 原始分数 被试数 值 2 3 --0.3548 序. 13 0 5.09 结果如表1: 3 3 -3.22 l2 0 4.11 根据这些数据可求解出此表中的难度参数估计值和能力参 4 4 —3.648 ll 2 3.3l 数估计值,跟准确的确定学生的信息。 5 4 -2.241 10 l 2.53 5、进一步研究的问题 6 4 —3.22 9 4 I.7l 本模型只采用了简单的对单参数模型的参数估计.采用了 7 哇 一1.498 8 5 0.8l 拉希模型进行参数估计,能够更精确的估计出结果.但是却只是 8 5 0.76 7 l2 0.22 单单从难度进行扩展,还需要更全面的扩展,对能力等因素要更 9 5 2.185 6 3 -I.19 加的研究和探讨。 t0 5 1.862 初值的问题.项目反应理论中发展了一套完整的参数估计 5 2 —1.96 l1 6 3.2l4 技术,这些方法通常都离不开迭代,迭代对初值要求比较高,要使 4 2 -2.6l 其误差最小.就要用到更加严密的参数估计分析。 12 6 4.564 3 2 —3.2l 13 6 4.564 2 1 ._3.B6 参考文献: 14 6 4.564 l 0 -4.73 1、高怀勇.金桂林.项目反应理论及其在计算机自适应测试中的应用 表1: 西华师范大学学报(自然科学),2008年