学科分类
/ 8
159 个结果
  • 简介:评分教师的评分效应和评分量表研究是研究主观题评分误差的核心问题。本论文以2006年高考政治(上海卷)第38题(论述题)为例,运用ACERConquest的RatersEffect模型研究,结果显示该大题基本没有表现出模糊性、趋中性和等级限制等评分误差,评分教师能够比较好地区分考生不同行为特征,除个别评分教师的评分一致性还有待提高外,评分松紧度差异比较显著。为此,作者提出根据松紧度调整考试分数的方法。

  • 标签: 主观题 评分 松紧度 一致性
  • 简介:目前考核评分标准,都是以解答正确为准,对不同解法,都是“一视同仁”,于是造成学生只注重答案正确性,而忽视了解题过程的合理性。长期以往,便形成学生思维的僵化,不

  • 标签: 评分漫谈 试卷评分
  • 简介:4、5期刊登了阅卷老师的阅卷日记,公布出来的目的是让我们的语文老师和即将参加中高考的学生,了解作文阅卷老师评分的心理动态与关注点。以点知面,在考场中写好作文应注意哪些问题,就一清二白了。

  • 标签: 阅卷老师 日记 评分 语文老师 心理动态 作文
  • 简介:大规模语言运用测试(performanceassessment)中评分员的评分质量直接关系到考生的命运和考试成绩的信效度及公平性,因此如何通过有效的评分员培训最小化评分误差是确保考试成绩有效性的重要问题。本研究运用多层面Rasch模型(MFRM)中所提供的丰富的统计信息对评分员的评分数据进行诊断分析,研究表明,MFRM输出的统计结果可以较为全面地诊断评分员在评分中所存在的问题,为评分员培训提供更加具有针对性的反馈信息,也可以作为区分评分员准确度高低的依据,为更多评分员误差研究提供有效的测量工具。

  • 标签: 评分质量 多层面RASCH模型 诊断
  • 简介:

  • 标签:
  • 简介:题目:一次数学考试,共六道判断题,考生认为正确的就画“∨”,认为错误的就画“X”。记分的方法是:答对一题给2分,不答的给1分,答错的不给分。考生A、B、C、D、E、F、G七人的答案及前六人的得分记录在表中,请在表中填出G的得分,并简单说明你的思路。

  • 标签: 评分 推理 数学考试 判断题 考生 得分
  • 简介:语言运用测试(1anguageperformanceassessment)因其对语言综合应用能力较为直接的测量和相对较高的真实性,成为越来越多大型考试中必不可少的组成部分。然而考试过程中所引入的评分员主观判断以及评分标准的建立与使用等因素都会在很大程度上影响考试的信效度和公平性。本文对语言测试研究领域中关于主观评分误差的研究,尤其是从评分员角度进行的研究,做了一次系统的梳理,并分析了不同的研究方法各自的特点和存在的局限,以期为更多从事评分误差控制的研究者和实践者提供丰富的参考依据。

  • 标签: 语言运用测试 评分效度 评分员 评分误差
  • 简介:对复习而言,"评分答案"不应是如同"参考答案"一般的随意文字,而应该反映一种"自觉"的思维过程。其"自觉"的基本特征是比较,或曰琢磨,或曰推敲,或曰斟酌——这应该是快速阅读的基本思维方式。

  • 标签: 思维过程 基本思维方式 参考答案 次要信息 二段 秋夜
  • 简介:4、5期将刊登阅卷老师评分的心里记录,公布出来的目的是让我们的语文老师和即将参加中高考的学生了解作文阅卷老师评分的心理动态与关注点。以点知面,在考场中写好作文应注意哪些问题,就一清二白了。

  • 标签: 阅卷老师 心理动态 评分 自白 语文老师 作文
  • 简介:文本翻译是翻译测试的主要形式,然而目前对文本翻译的评分与命题仍缺乏系统的研究。本文首先进一步明确了文本翻译测试的内涵,指出绝大多数文本翻译测试都是以学生译者为对象、以翻译教学为背景的。随后文章对现有的文本翻译测试评分方式做了述评,认为它们往往忽视了翻译测试依托于翻译能力这一根本问题。而现有对翻译能力的研究还需进一步实证化、条件化和具体化,以便应用于翻译测试。文章最后讨论了对文本翻译测试命题的若干看法,提出了作者自己的设想。

  • 标签: 文本翻译 翻译测试 学生译者 评分与命题 能力构念
  • 简介:在作文教学实践中,笔者有一个深切的体会,平时给学生的作文评分。与其“客观”“公正”,不如注重实效。

  • 标签: 作文评分 注重实效 教学实践 学生
  • 简介:二/外语写作测试的评分是一个复杂的过程,是语言测试界研究的热点领域之一。本文综述了评分方法、评分标准及其设计方法、评分模式、评分员差异性(variability)、计算机自动评分等方面的理论和实证研究成果。文章指出,评分员的评分受到多种因素的影响,其评分行为和评分过程仍需深入研究;自动评分技术应用前景广阔但仍有待完善。

  • 标签: 二/外语写作测试 评分标准 评分模式 评分策略 评分风格 自动评分
  • 简介:2009年浙江高考阅卷,一篇题为“朝圣”的作文.引发了较大的争议。一种意见认为此文可判为56分,因为作者审题恰当,语言功底扎实,结构独特,全文透露出难得的书卷气;另一种意见则认为全文语言晦涩,主题不清。逻辑混乱,是典型的“天书型”文章。最后,阅卷组综合各方意见,此文被判为40分(内容分16分,表达分21分,发展分3分)。

  • 标签: 作文评分 高考 潜规则 解读 语言功底 2009年
  • 简介:不同于选择题和填空题,数学解答题要求写出必要的文字说明、证明过程和演算步骤。而不少同学重结果、轻证明,更不重视文字说明,因此往往会在解答上丢掉不该丢的分数。〈br〉那么在解答题中,究竟有哪些内容必须书写清楚,才能避免不必要的扣分呢?

  • 标签: 解题规范 评分标准 文字说明 证明过程 解答题 填空题
  • 简介:本文分析讨论了英语专业四、八级考试写作评分员阅卷前进行专项培训的过程与反馈情况.通过问卷调查和评分员的访谈,发现写作专项培训因其较强的针对性,得到了大部分评分员的认可,可以帮助其更好地掌握新的评分标准,从而确保阅卷质量.

  • 标签: TEM写作 专项培训 评分标准 评分员
  • 简介:本文从评分人决策的变化探讨了评分人个性化反馈信息的有效性。研究人员首先邀请了三位不同经验和背景的CET4作文评分人对30篇CET4模拟作文评分并提供三条评分理由,然后对另外10篇作文进行有声思维。评分结束一周后,评分人收到包括多层面Rasch模型(MFRM)的分析结果(严厉度、内在一致性和偏差)以及评分理由编码分析结果的个人反馈信息报告。阅读完反馈报告后,评分人接着对新30篇CET4模拟作文评分并对另外10篇作文进行有声思维(其中5篇作文和前测相同)。本研究通过对比分析反馈前、后相同的5篇作文的有声思维数据,结果发现反馈信息能帮助评分人重视评分标准相关特征,并调整自己的决策行为。

  • 标签: 个性化反馈 多层面RASCH模型 有声思维
  • 简介:摘要: 现阶段的社会发展及其迅速,信息化、数字化已经进入我们生活很长一段时间了,而学校教育管理也要紧跟时代的脚步,融入到这一趋势当中。运用量化评分实施班级管理,将学生的日常行为规范、学习态度、仪容仪表等等方面利用信息化、数字化的方式表现出来。这样不但可以提高班级的管理水平,而且对学生的成长也有所记录,是现代化教育的一种高水平体现。

  • 标签: 必要性 运用策略 可行性 透明化 实效性
  • 简介:学生的智力活动是一个由思维结果和思维过程组成的两面体。现行的学业成绩测验是以学生思维活动的结果为评价标准的。它关心的只是学生智力活动的结果是否正确,而不关心获得正确结果的过程是否简捷巧妙。因此,也就不可能发现学生在智力活动过程中表现出来的差异,这不利于促进学生的智力发展。为此,本文建议在现行的学业成绩测验中,增加对学生智力活动过程的评价内容。

  • 标签: 思维结果 思维过程 简缩性 多样性 独特性