学科分类
/ 25
500 个结果
  • 简介:本研究的目的是描述一个用于测量写作能力的多面Rasch(FACETS)模型。该FACETS模型Rasch测量模型的多元变量拓展,它可为写作测评中的校标评分员和写作题目提供框架。本文展示了如何应用FACETS模型解决大型写作测评中遇到的测量问题。参加全州写作考试的1000个随机抽取的学生样本被用来显示该FACETS模型。数据表明即使经过强化训练,评分员的严格度有显著区别。同时,本研究还发现,写作题目难度的区分,虽然微小,却具有统计意义上的显著性。该FACETS模型为解决以作文测评写作能力的大型考试遇到的测量问题提供了一个有前景的途径。

  • 标签: 大型写作能力测评 FACETS模型 分数评级调整
  • 简介:本研究利用多面rasch模型(MFRM)评估大学生“多元统计方法分析”课程的能力水平,并分析题目的难度和评分者的严苛度。研究结果显示,多面Rasch分析可以很好地解决开放式考试中对于学科能力的评估,其评估结果与学生的反馈一致。

  • 标签: 多面RASCH模型 表现性评价 学科能力评价
  • 简介:本研究以概化理论和多面Rasch模型为工具,对某市教育教学能力测试的一批实测结果进行了分析,旨在探索影响此类测试评分的因素及其作用机制,为完善测试设计和评分培训提供依据。研究结果表明,影响教育教学能力测试的主要因素是任务难度、评委宽严、评委的跨任务一致性和任务的跨考生难度。当前的教育教学能力测试只适宜做相对决策,不适宜做绝对决策。建议在以后的测试中通过提高测试任务的数量和加强对评分员的针对性培训来提高评分可靠性。

  • 标签: 教育教学能力测试 概化理论 多面RASCH模型
  • 简介:目的:探究幼儿师范生口语表达能力水平与结构,分析幼儿师范生口语测试中的评分者效应,以提升幼儿师范生口语测试公平性,促进幼儿教师口语课程教学效果。方法:以某高校学前教育学院举行的幼儿师范生口语大赛为例,运用多面Rasch技术分析本次大赛所得到的测评数据。结果:幼儿师范生口语表达能力水平相差较大,六位评分者评分严格,且差异明显,评分者的前后一贯性差,评分等级设置过于分散,高等级与低等级未能发挥相应作用。结论:幼儿师范生口语表达能力是多成分心理特质,需要从多方面训练,测试评分偏差源于评分员对评分规则的熟知度差,口语测试应当合理分散进行,过于集中测试导致的评分疲劳等会影响评分公平性。

  • 标签: 教师口语 多面RASCH模型 评分者效应 幼儿师范生
  • 简介:七十年代以来,项目反应理论(ItemResponseTheory,IRT)成了测量专家关心的主要课题之一。IRT中单参数Log-istic模型常称为Rasch模型,它是由丹麦数学家GeorgRasch沿着与其他项目反应模型非常不同的路线推导出来的本文旨在介绍Rasch模型在实际中的一些应用和一种模型参数的估计方法。这种方法可以借助于手算完成,从而使普通中学老师也可以作一些IRT的题目分析工作。一、模型及其应用IRT理论认为,潜在能力测量模型至少应该包括被测对象(考生)的行为反应与潜在能力的度量。前者是可观察的,后者是待估计的。Rasch模型可以表示为

  • 标签: RASCH 近似估计 中学老师 项目反应理论 样本资料 随机波动
  • 简介:本文以贵州师范大学共90个大一新生在症状自评量表上的数据为实例,讨论Rasch等级模型在设计和修订等级量表中的应用,以及如何应用Rasch等级模型的某些参数如选项频率、平均测量值、临界值、概率曲线、选项拟合指数等来对等级量表的选项分类数目、选项标签进行直观的分析和检验,从而获得高质量量表。实例分析结果显示量表的各项指标均符合Rasch等级模型的规定,数据对模型的拟合非常好。

  • 标签: Rasch等级模型 平均测量值 临界值
  • 简介:Rasch模型具有被试参数和项目参数相互独立的性质,即被试能力与项目难度无关。本研究以某年度大学入学考试数学学科的实测成绩数据为例,在随机抽样、不同性别抽样、不同水平群体抽样等条件下,对Rasch模型项目参数不变性进行了验证研究。研究表明:Rasch模型项目参数不变性验证的前提条件较为严格,需要排除诸多干扰因素的影响;Rasch模型项目参数不变性的验证存在一定的误差,无法实现与理论一致的“不变性”;Rasch模型项目参数不变性没有统一的标准,需依据实际问题确定。

  • 标签: RASCH模型 参数不变性 DIF 抽样
  • 简介:本研究采用Rasch模型涉及的拟合指数、误差统计、气泡图、信度与分隔系数、试题难度和考生能力在变量图上的分布状况以及DIF参数来对全国高考英语II卷完形填空题的质量进行研究.304位广东某市高二学生在规定的时间内完成了2016年全国高考英语II卷完形填空题,笔者用Winsteps软件分析考生的答题表现,结果发现试题总体而言质量较好,符合测量目标,能为多数考生提供准确测量,但整体区分度不足,个别试题存在群组间的测量偏差,有待改进.

  • 标签: RASCH模型 高考 完形填空题 质量分析
  • 简介:大规模语言运用测试(performanceassessment)中评分员的评分质量直接关系到考生的命运和考试成绩的信效度及公平性,因此如何通过有效的评分员培训最小化评分误差是确保考试成绩有效性的重要问题。本研究运用多层面Rasch模型(MFRM)中所提供的丰富的统计信息对评分员的评分数据进行诊断分析,研究表明,MFRM输出的统计结果可以较为全面地诊断评分员在评分中所存在的问题,为评分员培训提供更加具有针对性的反馈信息,也可以作为区分评分员准确度高低的依据,为更多评分员误差研究提供有效的测量工具。

  • 标签: 评分质量 多层面RASCH模型 诊断
  • 简介:摘要:目前机场大多位于城市郊区,出行需要换乘其他交通方式。航站楼内空间环境密闭,客流量集中,所以机场航站楼内的换乘导向系统标识应该具有高辨识度、易理解性和连续性,能够引导乘客安全快捷完成换乘。本文以沈阳桃仙机场为例,对机场换乘导向系统满意度进行问卷调查,基于Rasch模型对问卷进行整体质量检测。结果显示:问卷与Rasch模型拟合情况较好,能达到问卷调查目的,对此提出换乘导向系统优化建议。

  • 标签:
  • 简介:摘要:目前机场大多位于城市郊区,出行需要换乘其他交通方式。航站楼内空间环境密闭,客流量集中,所以机场航站楼内的换乘导向系统标识应该具有高辨识度、易理解性和连续性,能够引导乘客安全快捷完成换乘。本文以沈阳桃仙机场为例,对机场换乘导向系统满意度进行问卷调查,基于Rasch模型对问卷进行整体质量检测。结果显示:问卷与Rasch模型拟合情况较好,能达到问卷调查目的,对此提出换乘导向系统优化建议。

  • 标签:
  • 简介:出于考试安全性的考虑,题目参数不等值的问题已经成了题库质量不高、作用不大,并直接损害考试信度、效度和公平性的一个突出瓶颈。文章以Rasch模型为例,结合WINSTEPS软件,对题目参数等值的意义、Rasch模型的特点、等值设计的方案,以及三种国际流行的题目参数等值方法,即同时校准方法、独立校准和链接相结合方法、固定参数校准方法,进行了详细解读。期待这些技术可以为我国的题库建设和考试工作带来积极意义。

  • 标签: RASCH模型 题库 等值
  • 简介:语言运用测试(languageperformanceassessment)是各种大规模语言考试中不可或缺的部分,但因为其测试环境中不可避免地引入了评分员的主观判断、测试任务的难度、评分标准的设定和使用情况等因素,使其信度、效度及考试的公平性都受到了质疑。多层面Rasch模型是项目反应理论(IRT)中经典Rasch模型在多个维度上的延伸,它的主要优势在于可以将考试环境中多个影响考生最终得分的因素纳入同一个数学模型中进行分析,并估算出各个层面的因素对考生成绩的影响程度。本文旨在对MFRM的工作原理和基本模型进行简单介绍,并系统梳理语言测试领域运用MFRM进行的相关研究,以期让读者更好地了解如何在语言测试研究中有效地运用这种统计方法。

  • 标签: 语言运用测试 多层面RASCH模型 评分员效应
  • 简介:摘 要:语言质量评估是指通过量化各种事务,给这些事务指派分数,最终实现不同的决策(选拔、评价、因材施教)。其目的是用科学的方法保证试卷的质量,确保可以精准地测量与教育相关的事务,保证根据分数做出的决策是合理的、公平的。但是如何保证这种合理性和公平性,则是长久困扰研究者的问题。多面拉希模型在分析语言运用及能力测试方面具有独特的优势,其“多层面”的特点非常适用于分析由评分员根据评分量表而生成的考试分数,特别是,其所产生的数据,能够准确反应语言质量评估的信度和效度。

  • 标签: 多面拉希模型 语言质量评估 信度 效度
  • 简介:Directions:Readthefollowingpassage.Thepassageisfollowedbyseveralquestionsorunfinishedstatements.ForeachofthemtherearefourchoicesmarkedA,B,CandD.Choosetheonethatfitsbestaccordingtotheinformationgiveninthepassage.Wenowthinkofchocolateassweet,butonceitwasbitter.Wethinkofitasacandy,butonceitwasamedicine.Today,chocolatecanbeahotdrink,afrozendessert,orjustasnack.Sometimesit’saningredient(配料)inthemaincourseofameal.Mexicansmakeahotchocolatesaucecalled

  • 标签: 中学 英语 课外阅读 阅读材料
  • 简介:在我之前的印象中,提到斯巴鲁这个品牌,首先想到一身拉力蓝的第五代双门翼豹车型,也许是因为小时候头文字D街机游戏玩多了,已经可以做到非常熟练的使用藤原文太的座驾。若问其他哪款车型最感兴趣甚至最钟爱,

  • 标签: 街机游戏 斯巴鲁 第五代 车型 双门 座驾
  • 简介:本研究运用多层面Rasch模型测量软件FACETS分析了计算机和15名专家评分员在一次广东省高考机助英语听说考试模拟测试中批阅215名考生口语录音的阅卷行为。研究发现:计算机自动评分和专家评分员评分的严厉度虽有显著差异,但并不会对考生能力分布产生决定性影响;计算机自动评分阅卷较低的评分偏差几率说明计算机自动评分比专家人工阅卷具有更高的内部一致性。

  • 标签: 多层面RASCH模型 机助英语听说考试 计算机自动评分 阅卷效度
  • 简介:[摘要]:有效的测评对提升教师课堂教学实施能力具有实质性意义。本研究以Rasch模型及“四基石”方法为指导,在文献研究及实践的基础上建构了教师课堂教学实施能力学习进程,以此作为理论框架指导设计教师教学实施能力测评量表。运用量表对样本进行试评、初测和再测,重在利用SPSS、Winstep软件对初测结果进行统计分析评估量表并对量表进行优化;最后运用正式量表进行再测,主要用Winstep软件对数据进行Rasch建模,通过信度、拟合度、Wright map、评分等级结构、一维性等指标检验量表的评估效果,同时借助SPSS软件辅以评分者信度。基于Rasch模型对教师专业发展具有重要实际意义。

  • 标签: []Rasch模型,教学实施能力,测评工具,优化
  • 简介:外表软弱而内心坚强,加上争强好胜而想做特殊的人,再加上脾气倔强,组成了一个多面的我。外表软弱的我我,是一个十分容易落泪的人,有一点不顺心的事我就落泪。记得上次老师让班长(我)唱歌,我自小对音乐不感兴趣,所以唱歌自然不是我

  • 标签: 老师 外表 脾气 班长 失败 内心