学科分类
/ 2
29 个结果
  • 简介:本文分析讨论了英语专业四、八级考试写作评分员阅卷前进行专项培训的过程与反馈情况.通过问卷调查和评分员的访谈,发现写作专项培训因其较强的针对性,得到了大部分评分员的认可,可以帮助其更好地掌握新的评分标准,从而确保阅卷质量.

  • 标签: TEM写作 专项培训 评分标准 评分员
  • 简介:本研究以"中国学习者英语语料库"中的大学英语四、六级考试作文为研究样本,比较300篇作文的人工评分和国内某自动评分系统结果的差异;同时利用人工和软件结合的方法,分析作文的词汇、句法、语篇和错误等四类语言类定量特征对人工和机器评分的影响,揭示人机评分差异的成因。结果显示,自动批改系统整体评分效度有待提高;机器所依赖的语言类量化特征在人工批改中的作用有限,评分依据的不同造成两者结果的差异。

  • 标签: 自动作文批改系统 大学英语四、六级考试作文 人机评分差异 语言类量化特征
  • 简介:武术段位制是中国武术协会制订并实施的一种全面评价习武者武术水平等级的制度。作为衡量技术水平等级的制度,其评分标准与方法是其中至关重要的一部分。文章对武术段位制技术考试评分规则的发展进行梳理,依据武术段位制发展的时间节点将评分规则的演变划分为形成阶段、改革阶段和发展阶段,为评分标准的最优化提供助力。

  • 标签: 武术段位制 评分规则 规则演变
  • 简介:英语自动作文评分系统不仅能节约大量人力、物力和财力,还对提高英语学习者英语写作水平起到非常重要的作用。本文系统分析了当下四种实现自动作文评分系统的路径,它们分别为基于非文本相关特征、基于文本相关特征、基于概率统计分类方法和基于深度神经网络的自动作文评分系统。依据分析结果,提出未来英语自动作文评分系统的主要发展方向是融合四种实现路径的优点、优化作文数据特征维度和提升作文练习的有效反馈能力。

  • 标签: 自然语言处理 自动作文评分 深度神经网络 概率统计
  • 简介:目前国内关于数学核心素养的研究非常丰富,但关于数学核心素养的评分标准模型却几乎找不到,本文尝试着提出几个关于数学核心素养的评分标准模型,通过该模型分析学生的数学核心素养水平,并希望对这方面研究做出一点贡献.

  • 标签: 数学核心素养 高中课标 评分标准模型
  • 简介:应用自动评分系统是教育考试评价领域中的未来发展趋势。为此,如何学习和掌握自动评分系统的技术是其关键。文章围绕自动评分系统中的数据准备、特征抽取、机器学习和结果输出等四个方面的技术进行了梳理,并对其中的问题进行了分析和展望。

  • 标签: 自动评分系统 人工智能 教育评价
  • 简介:以2012年高教社杯全国大学生数学建模竞赛A题为例,建立几种葡萄酒品尝评分的可信性度量的评价准则.以品酒员和酒样品为控制因素对品尝评分进行方差分析,比较均方差和相应F观测值度量评分差异主要是来自品酒员还是来自酒样品;通过对各组品尝评分的协同系数检验,实现对各组品酒员评判标准的一致性评价;利用品酒员评分的分值偏差和排序偏差综合集成结果,建立品酒员可信度量化模型,并排列葡萄酒样品的综合评价优化结果;通过对品尝评分的可靠性研究和重复测量的方差分析实现对品酒员可信性度量.SPSS21计算表明四种准则在应用中简单易行,研究结果可以作为评价评审专家选择、调整和淘汰的依据.

  • 标签: 葡萄酒品尝评分 可信性 方差分析 Kendall协同系数检验 综合集成评价
  • 简介:美国国家教育进展评估(NAEP)数学测评旨在了解学生的数学知识和技能,以及学生运用他们的知识解决问题的能力。NAEP2013数学测评分析框架包括内容领域和数学精熟度,其中,内容领域包括数的性质和运算、测量、几何、代数、数据分析、统计和概率等内容;精熟度按照复杂性主要分成低、中、高三个程度。NAEP数学试题注重生活情境,强调学生对图表或表格的认读和解释能力,并注重学生数学思维能力的养成。NAEP2013数学测评及试题设计启示教师,应在数学问题的设计中注重情境的真实性与合理化,凸显数学的应用价值;增强试题的开放程度,促进学生数学思维的发展;重视数学问题解决过程,以合理性为评价准则。

  • 标签: NAEP2013 数学测试 试题特点 中学 数学教育
  • 简介:班级管理一直被认为是班集体发展的重要环节,而在小学中,该如何发挥学生的主体性,调动学生积极参与班级管理,增强学生的自我管理能力,是当今教育的热点。为了探讨小学中高年级班级管理的现状,以中山市朗晴小学为研究对象,重点探究了传统班级管理方式中出现的问题,并提出使用班级评分板进行管理的解决措施,阐述了班级评分板的使用对小学中高年级班级管理产生的影响。

  • 标签: 中高年级 评分板 班级管理
  • 简介:目的:探究幼儿师范生口语表达能力水平与结构,分析幼儿师范生口语测试中的评分者效应,以提升幼儿师范生口语测试公平性,促进幼儿教师口语课程教学效果。方法:以某高校学前教育学院举行的幼儿师范生口语大赛为例,运用多面Rasch技术分析本次大赛所得到的测评数据。结果:幼儿师范生口语表达能力水平相差较大,六位评分评分严格,且差异明显,评分者的前后一贯性差,评分等级设置过于分散,高等级与低等级未能发挥相应作用。结论:幼儿师范生口语表达能力是多成分心理特质,需要从多方面训练,测试评分偏差源于评分员对评分规则的熟知度差,口语测试应当合理分散进行,过于集中测试导致的评分疲劳等会影响评分公平性。

  • 标签: 教师口语 多面RASCH模型 评分者效应 幼儿师范生
  • 简介:语言测试中的行为测试常和专门用途英语测试相结合.本研究设计了一项模拟现实交际任务的医务英语写作行为测试:考生扮演医生的角色并完成对某位患者的诊断过程,在获得相关信息的基础上撰写英文病历书,测试形式以“听读后写”为特点,测试具有真实性.评分量表兼顾语言技能和基于特定工作的行业技能,体现现实交际任务的评价准则.三个评分分项分别为语言运用水平、对病情的理解和把握情况、病历书的结构和逻辑.评分结果分析表明,该量表具有较好的信度和效度.该测试的任务形式和评分量表都独具特色,对类似的专门用途英语测试的开发和研究具有一定的借鉴意义.

  • 标签: 行为测试 医务英语写作测试 评分量表 信度与效度
  • 简介:探讨品管圈活动对提高教学查房评分的作用。通过实施品管圈活动,找出影响教学查房质量的主要因素,制订相应对策,分阶段实施与改进对策,比较品管圈活动前后的教学查房评分。教学查房评分从品管圈活动前的(65.76±19.04)分提高至活动后的(87.33±5.14)分,目标达成率111.82%,进步率32.80%,活动前后教学查房评分差异具有统计学意义(P<0.05)。将品管圈活动应用于教学查房,能有效提高教学查房评分,提升住院医师规范化培训质量。

  • 标签: 住院医师规范化培训 教学查房 品管圈
  • 简介:探讨分段诊断性刮宫术(分段诊刮术)手术模型和考核评分系统在妇产科住院医师临床技能培训中的作用。选取2015年1月至2017年9月在北京大学人民医院妇产科住院医师培训基地轮转的43名住院医师,分别进行出科考核和年度考核60人次。考试中,要求住院医师根据所给病例,在女性骨盆模型上完成分段诊刮术,并表述相应的术前、术中和术后处理。考试评分表中包含与手术相关的10个项目,分别为术前3项、术中2项、术后5项。统计各项得分,评出优良、及格、不及格3个级别,以综合判断住院医师对手术的掌握情况。对考试不及格者要求训练后重新考试,直至及格。在各项评分中,无菌操作和病历记录2项不及格比例较高,分别为33.3%和68.3%。另外,在术前准备和知情同意项目中也各有18.3%不及格,其余各项不及格比率〈10.0%。具体分析评分表中各个考核项目,找出完成分段诊刮术过程中的不足之处,以增强技能培训中的针对性。模拟分段诊刮术及考核评分系统是检验住院医师对手术掌握情况的一种方法,量化分析手术完成情况对加强住院医师基本手术技能培训和临床思维的培养有积极作用。

  • 标签: 模拟技能训练 妇产科 分段诊刮术 技能评分表 住院医师规范化培训