学科分类
/ 1
4 个结果
  • 简介:通过对经典测量理论与项目反应理论在基本假设、测验精度计量、测验的标准误以及测验项目的筛选等四个主要领域的比较,可以发现项目反应理论具有被试能力估计的项目选择独立性、项目难度参数与能力参数的刻度统一性、项目参数估计的样本独立性、估计测量误差的精确性等几个优点;但是在某些模型中存在单维性假设难以满足、测验条件要求严格以及数学模型简约性差等需要解决的问题。

  • 标签: 经典测量理论 项目反应理论 参数
  • 简介:相关研究表明,IRT在教育考试评价中比CTT具有诸多优点.本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异.研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度.实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景.

  • 标签: CTT IRT 考试评价
  • 简介:本文以某届国际奥林匹克运动会女子跳水决赛为例,综合应用CTT、GT和IRT三大测量理论进行评分者信度分析,从不同角度揭示评分者之间和评分者内部的差异情况。结果表明:CTT的评分者信度分别为0.981和078;GT的概化系数和可靠性指数分别为0.8279和0.8271,比赛中所采用的7名评委分别对选手在5轮上的跳水表现进行评定的决策是比较适宜的决策;在IRT中,相对而言,评委5在7名评委中最为严厉,评委2最为宽松,但评委之间在宽严程度上的差异不显著,评委1和评委4在自身一致性上存在问题,不同评委在评定不同选手、不同难度系数动作和不同轮数上存在偏差,但未达到显著性水平。基于本文的分析,可以了解三种评分者信度分析方法的特点及各自优势,为评分:者培训和提高评分信度提供有用信息。

  • 标签: 评分者信度 经典测量理论 概化理论 多面RASCH模型 跳水决赛
  • 简介:问卷是科学学业质量监测中常用的测试工具,也是开展科学教育实证研究的重要工具,工具的质量直接决定科学学业测评和科学教育研究的科学性及可靠性。基于经典测试理论(CTT)和项目反应理论(IRT)系统阐述科学问卷质量分析的常规过程及技术方法,并对问卷质量评估相关参数的内涵进行深入解读和分析,以帮助科学学业测评开发人员以及科学教育研究者系统理解和掌握问卷的质量分析方法和技术,从而有效提高科学问卷的效度,为进一步提高科学学业质量测评和科学教育研究的科学性及有效性奠定基础。

  • 标签: 经典测试理论 项目反应理论 问卷 质量评估