一级学科整体水平评估的短板与改进

(整期优先)网络出版时间:2023-04-19
/ 5

一级学科整体水平评估的短板与改进

赵子博,刘昱麟

(大连理工大学,辽宁 大连,116024)

摘  要:通过将同样把学科作为评估对象的英国研究卓越框架(REF)与一级学科整体水平评估(CDR)进行横向对比,发现了在评估机构的性质、评估专家的构成、评估指标的导向等多方面的显著差异,需要从评估指标去功利化、评估主体去行政化、评估对象去短视化三个方面入手,改变现有的评估机构行政色彩浓重和评估体系功利主义盛行的问题。

关键词:一级学科;整体水平评估;短板;对策


一、问题提出

“以评促改、以评促建、以评促管、评建结合、重在建设”是我国高等学校教学质量评估工作的指导原则。学科作为高等学校办学的基本功能单元和重要结构单元,其水平高低直接反映了一所高校在教学、科研和师资等方面的实力,直接体现了高等学校的办学质量[[i]],是衡量一个院系乃至一个学校教学能力和质量、承担着培养人才、科学研究、服务国家等重大战略需求重任的重要因素。因此,学科评估作为我国高等学校教学质量评估工作的重要部分、有效补充以及高等教育学科建设质量保障体系的重要环节,同样应该被给予足够的重视,仍需遵循“以评促改、以评促建、以评促管、评建结合、重在建设”的指导原则。

一级学科整体水平评估(CDR,China Discipline Ranking)是我国2002年创办的国家级学科评估项目。该项目在多年的发展历程中,为中国的学科评估工作发挥了重要作用。经过五轮评估工作,CDR现已成长为一个拥有95个一级学科、513个单位下的7449个次级学科、9套不同的指标体系框架、评估体系初具中国特色的评估项目。距离CDR的诞生已经过去了二十年,虽然CDR在一次次的评估工作中不断进行着优化设计,但我国的评估之路相比于其他一些高等教育较为发达的欧美国家,发展时间短、改革经验不足、国情更加特殊,因而仍然存在着不少问题,需要政府和高教人的持续努力。

二、一级学科整体水平评估的短板

(一)CDR与REF的对比

英国是世界上高等教育最发达的国家之一,其高等教育可以代表国际高等教育发展的先进水平,其完备的质量保障体系和卓越的人才培养质量得到了国际社会和国际高等教育界的公认[[ii]]。英国高等教育的质量评估始于上个世纪80年代,发展到现在,已经成为包含科研水平评估(Research Assessment Exercise,RAE)、教学质量评估(Teaching Quality Assessment,TQA)和学术质量审核(Academic Quality Review,AQR)等多个评估项目在内的评估体系[[iii]]。我们不妨以学科为评估对象的英国研究卓越框架(Research Excellence Framework,REF)为参照对象,通过其与CDR的对比,寻找我国CDR的短板和突破口。

REF(英国研究卓越框架)的前身是RAE(英国科研水平评估),二者虽然名称不同,但其实是同一评估体系,是两个不同的发展阶段。RAE创建于1986年,经过28年的发展,于2014年升级为REF。REF成立的最初目的是减少RAE过于复杂的评估流程,优化为一个程序精简、费用低廉、高效易行的新评估框架[[iv]]。二者在评估中介、评估目的、评估原则和评估对象等方面几乎没有差别[[v]]。因此,为了方便对比,本文选择REF作为与CDR进行比较的对照组。

REF和CDR都是国家级规模的高等教育评估项目,二者都以促进高等教育机构的科研质量提升为最终目的[[vi]],以学科为评估对象,以大学和学院排名的方式呈现评估结果。二者的不同之处也有很多,具体体现在机构性质、专家组成、指标体系、评估流程、评估主体、评估作用等方面。本文拟对前三项进行简单对比,以期从中获得某些启迪。

1.评估机构的性质

REF的评估方为高等教育基金委员会(HEFC),这是一个由英格兰高等教育基金委员会、苏格兰高等教育基金委员会、威尔士高等教育基金委员会和北爱尔兰就业与学习部共同组成的评估集团。HEFC为英国政府委托的第三方中介机构,这种半官方的中介机构在政府和学校之间起着重要的缓冲、调和作用。之所以说它很重要,是因为政府意志通过该机构间接作用于高校而非直接参与管理,这样就在很大程度上削弱了政府意志对整个评估流程的行政压力和利益牵扯,杜绝了“政府自我评估”的怪像和缺陷,防止出现“和尚分粥”式的资源分配困境。学校和教育主管部门分别作为评估体系中的“第一方”和“第二方”,都与评估的根本对象“教育质量”有着直接的利益关系。如果不经由第三者之手就直接进行评估,那么双方都会为了维护自己的利益,采取有利于自身发展的评价标准进行评价,使得评估变成一场自说自话、自导自演、自我贴金的闹剧,从而使得评估结果的客观性和公正性大打折扣。因此需要有真正具备独立性的第三方评估机构来进行评估工作,防止政府行政权力的影响渗入到高校的学术发展中,导致对学术权力的干预和挤压

[[vii]]

我国的CDR是由教育部学位与研究生教育发展中心(以下简称学位中心)以第三方方式开展的非行政性、服务性评估项目[[viii]]。虽然名义上自称“第三方”、“非行政”,但实际上仍然受教育部和国务院学位委员会的直接领导。学位中心实际上相当于教育部的一个下属部门,负责实际的评估工作,而教育部和国务院学位委员会负责评估的管理和监督工作。政府的意志和行政之手虽然无形,但仍然无处不在地笼罩着整个评估活动,让所谓的“第三方”处在一个朦胧模糊的尴尬地位。

2.评估专家的构成

REF采用“双层专家评估制”,评估专家分为主、次两个专家组,主专家组负责对次专家组提供指导,次专家组负责具体的评估工作。评估成员通过公开申请,然后由高等教育基金委员会任命。REF很注重评估成员的来源广泛、身份多样,需要具有多学科背景、不同机构工作经历或不同工作区域的候选人[[ix]],如大学教授、学者、海外顾问、企业专家、科研用户等,这样可以保证评估的权威性和代表性。而在REF2021中,评估方式更是从学术界的“同行评议法”升级为来自社会各界、基于文献计量的“专家评议法”,进一步扩大了评估组成员的来源范围,展现了英国在REF评估方面“面向国际”的野心。

我国CDR一直采用“同行评估”的方法,专家组成员基本都是学科专家,社会参与度严重不足。在第四轮学科评估工作中,专家组成引入了一些行业企业专家,并在部分理工学科试点引入海外专家评价学科的“国际声誉”[8]。在2020年公布的第五轮学科评估方案中,CDR进一步加强国际评价,首次在教育学、心理学、考古学、工商管理、音乐与舞蹈学、设计学等哲学社会科学学科设置学科“国际声誉”指标,邀请境外专家开展学科声誉调查[[x]],算是评估工作向社会和国际迈进的又一大步的尝试。越来越多的海外专家现身于CDR的评估工作中。

3.评估指标的导向

REF的评估体系包括科研成果、科研影响和科研环境三项。对于各高校提交的资料,REF对其的要求是需为“评价时段内该学科点发表的出版物及其他可以评价研究的产出详情”,且每位研究人员最多可以提交4个最有代表性的科研成果,然后从原创性、重要性和严谨性三个方面进行评估。整个评估指标体现出重质量、重时效、重描述的特点,对数量和统计并不是刚需。

我国CDR2017的指标体系分为师资队伍与资源、人才培养质量、科学研究水平和社会服务与学科声誉四个部分。在最新的第五轮学科评估中,“人才培养质量”被提到第一位,成为评估的第一项指标。第五轮学科评估工作以中共中央和国务院印发的《深化新时代教育评价改革总体方案》为改革的纲领性文件,强调质量、贡献和特色等质量指标,淡化论文收录数、引用率、奖项数等数量指标[10]。这是由于在之前的几次评估中,CDR以量化评价为主、以声誉评价为辅,造成了许多高校过分追求数量而不顾质量的不良影响。为此,第四次评估通过设置上限(达到上限值不再加分)的方法克服评估中的“唯数量”倾向。但其实这一做法本质上仍未脱离结果导向的量化思维,因为高校为了能够在这一指标得分中达到上限值,还是会彼此在暗中进行一场“腥风血雨”的评估大战。

(二)CDR存在的主要短板

1.评估机构行政色彩较浓

由于我国在还未建立起合法有效的第三方评估机构时就开始了评估工作,因此由政府主导的评估是不可避免的后果。学位中心是教育部直属的事业机构,体现的是教育行政部门的意志。由于利益相关,因而几乎无法保证评估过程和结构的公平和客观。政府具有强权威性,是资源的掌控者,由政府直接主导的评估往往会对大学产生过度干预[[xi]],让结果带有选拔性和评优性。排名与资源挂钩,这几乎成为大家心照不宣的“潜规则”,因而没人想在评估中落后。这就使得一些大学即使不想也不得不参与到这场评估与排名的激烈竞争中去。只要行政化一天不脱离学科评估的外壳,各大学对排名的畸形追求就一天不会消失。除此之外,我国CDR采用的是统一化的评估标准和模式,这无形中修剪掉了许多学科的个性和特点,迫使它们朝着同质化和标准化的方向发展。排名无法展现一所学校的特色、历史、长处、优势,只能让大学在为了提升排名的“锦标赛”中求大求全、舍小舍精,各美其美的学科生态林由此被破坏,成为千篇一律、特色缺失的克隆林。在自然界中,只有生物的多样性才能带来生态的平衡与繁荣。同理,只有学科的多样性才能使我国的学科生态繁荣发展,进而带动学术的繁荣。

由于排名结果往往与政府的资源投入挂钩,所以各高校不惜削足适履、杀头便冠、弄虚作假、巧立名目,以牺牲弱势学科、低档学科的代价和“丢车保帅”的策略为所谓的“优势学科”、“一流学科”让渡资源,使弱科更弱,甚至被人为分解和抛弃。殊不知,一流大学的形成是以许多一流学科的建成为基础的,没有许多一流学科的支撑,一流大学的“一流”只是脆弱的、孤独的、易逝的昙花一现。而一流学科的建成应该是以学科的多样化和自由发展为基础的,没有自由的发展环境,学科的生长和发展就无从谈起。一花独放的学科终究不是学科真正的春天,只有百花盛开的学科大花园才是我们追求的最终目标。

2.评估体系存在功利主义倾向

我国学科评估深受工具理性思想的驱使也在某种程度上阻碍了“以评促建”目标的实现。工具理性是一种崇尚精确计算、追求定量指标,以工具崇拜和技术主义为目标的价值观[[xii]],体现在评估中就是评估政策效率导向、评估指标定量为主、评估结果量化排名。首先,从1987年的重点学科评选一直到2020年的第五轮学科评估,我国始终没有摆脱以效率为导向、以选优为核心的评估本质。而且排名往往与资源分配直接挂钩,导致高校热衷于展现和美化参评学科的各项数量指标,极力追求最优的评估结果,而不是从评估中反思和改进。这无形中强化了“学科评估—工具理性—应付评估—宣传结果”这一恶性循环,使得本应该作为手段的学科评估异化为最终的目的,而缺少评估对象反思、评估学科反馈、评估高校反省等更具内涵的流程。其次,评估体系尤其是评估指标表现出以客观评价为主、主观评价为辅,以量化评价为主、声誉评价为辅的特点。如各种论文收录数、论文引用率、获奖数、著作出版数等定量指标,凡此种种,不胜枚举。虽然在第五次评估中采取了“计量评价与专家评价相结合”“中国期刊与国外期刊相结合”的“代表作评价”方法,同时淡化论文收录数和引用率,不将SCI、ESI相关指标作为直接判断依据,坚持代表性成果专家评价与高水平成果定量评价相结合[10],但是评估的基本框架还是基于定量数据。再次,许多学校为了提交有利于本学科评估的材料,以获得更高的排名结果,或者防止某些处在名单边缘的“濒危”学科被裁撤,往往会采取一些“特殊”手段对数据进行“美化”。比如说:忽视或取消排名不佳的学科;将某一学科下的成果转移到另一学科下,以获得体量更大的呈现结果;建设重点由新兴学科、交叉学科、特色学科等短时间内难以产出成果的学科转向成果丰硕老牌学科、王牌学科。最后,评估结果往往以排名或分档的方式呈现,而人们对高名次和高分数的追求让学术性质的学科建设与学科评估变成竞技性质的排名大战。每所高校都竭力去宣传自己的优势排名和光荣成果,以此获得更多优秀人才的青睐。而对于需要改进的不足之处,则能遮则遮,能混则混,最终造成学科评估实际上只是为前20%的优势学科服务,而对后80%的学科起微弱甚至反作用的“二八效应”[12]

三、一级学科整体水平评估的改进

学科是大学的细胞,是大学的基本组成单元。一个大学如果充满活力和创新力,那么一定会体现在学科上[[xiii]]。但是,目前我国关于高等教育的研究,总是谈学校、学院的多,讲学科的少,这无形中助推了对我国学科建设与发展的忽视与遮蔽,不利于真正解决高校学科在发展中产生和遇到的问题。本文将中英两国的评估项目进行对比,除了想要找出差异之外,更重要的是通过发现高等教育在我国现实社会中已经存在的现有问题和即将发生的潜在问题,为社会和高校提供一个反思自我的途径,将评估作为一种管理手段和工具,促进大学在学科乃至于教学等方面的发展与建设。

(一)评估指标去功利化

评估的目的是为了改进,但如果没有确定好评估的指标、没有把握好评估的尺度,就会对高校的发展起到反向的误导作用。学科评估作为一种需要确定一定价值标准和现实期待的服务项目,会因为立足点的不同而产生不同的价值取向、不同的利益取舍、不同的服务面向,进而决定指标体系的设计。英国在REF中引入“科研影响”作为三项评估指标之一,这是一种使评估本身和评估影响尽可能远离功利主义的创新做法,其定义为:“对学术界以外的经济、社会、文化、公共政策或服务、健康、环境或生活质量所产生的影响、改变或益处”,强调科研在非学术方面的影响。具体来说,就是人类与动物健康、文化创造、商业经济、公共政策、法律与服务、职业道德与行为实践、环境、生产、参与学习、社会福利等九个社会维度[[xiv]]。我国第四轮的CDR,在原“学科声誉”的指标中增加了“社会服务贡献”这一项内容。“社会服务贡献”指“通过各学科提供的服务经济社会建设总体情况和若干‘代表性案例’”[8],使学科建设成效与社会经济发展挂钩,助推了各高校对经济效益和短期利益的狂热追求,不利于高校在评估后进行自我反省和内涵式改革,反而进一步加剧了各高校对高回报、高收益资源和产出的追求,引发对“功利化”难以控制的多米诺骨牌式连锁效应。

由于评估指标的选择与设置不当,再加上社会风气的不良影响,使得各高校对学科评估的关注度向来都是如何能获得更高的排名、如何能提交更多的材料、如何能呈现出更好的数据,而忘记了开展评估的初心—以评促建、以评促改、以评促管、评建结合、重在建设。很多高校都变得为了评估而评估、为了声誉和面子而评估,却不去挖掘评估结果背后的内涵,不从中吸取对学科建设的批判和反思,这是评估的异化,是教育的悲哀。很多时候,评估成为了一种获取社会关注和外界资源的手段:真正有实力的学校一定会上榜,所以对这些学校来说,这类评估不过是一种对已有实力和地位的加固与印证,以及成为供其他学校“瞻仰”的对象。处于中等水平的学校常常需要与排名相近的学校进行一番“腥风血雨”的争夺,以获取更高的排名地位,占据更好的舆论之地,便于后续分配到更多的教育资源。而实力较差的学校则早早地被抛弃在评估活动之外,从一开始就没有搭上“以评促建”的快车,成为这一社会活动的“局外人”。我们希望看到多元化的评估标准、有启发的评估建议、有针对性的评估结果,而不是那种对已有社会认知和共识的结果重现,这种从评估初始就一眼望得到结果的评估活动,其结果除了成为人们茶余饭后的谈资和自我满足的成绩,几乎再无其他作用。应该将现有的指标范围扩大化、指标内容多样化、指标形式开放化,多用定性、少用定量的评判标准,让众高校在少限制、多开放的评估指标中,找到能结合本校特点和历史发展的独特之路,建设成为有自我特色和中国特色的大学。而不是将目光局限于对数量、效益等功利化事物的追求上,成为被困在追逐数字和排名山坡上的西西弗斯。

(二)评估主体去行政化

由于我国国情的特殊性,政府对大学的抓手一直比较紧,评估工作亦是如此。虽然国家在努力转变政府在教育领域的角色,但实际上,我国的学科评估始终没有摆脱行政主导的现实。不光学科评估的供给主体是教育行政部门,而且评估结果也成为了教育行政部门分配资源的依据。前者主要体现在政府掌控着评估机构的设立与运行、评估工作的标准与流程制定、评估工作的开展时间等内容[12]。比如说,同样都于2017年公布的第四轮一级学科整体水平评估结果和首轮“双一流”建设高校及学科名单,就被很多人认为是密切相关的事物,即第四轮一级学科评估结果实际上是为“双一流”选拔提供参考的数据来源。

目前,在“管办评分离”的趋势下,很多“第三方评估机构”应运而生。表面上看,我国正朝着建设合格第三方评估机构的良好方向发展,实际上,这些都是披着“第三方”外皮、内部仍然由政府管控的机构。我国第三方教育评估的发展历史较短,改革经验不足,受国情限制较大,因而一直处在“分权”和“放权”的拉锯之争中,至今仍未找到平衡点,且可以预见,在未来较长的一段时间内,我国教育评估将会一直处于这种未平衡的状态中。因为我国还未建立起保障第三方机构的法律法规,所以如果第三方评估机构真的脱离了与政府的关系,那么它们的权威性、独立性和合法性都荡然无存,这些第三方评估机构就彻底丧失了存在的意义[[xv]]

(三)评估对象去短视化

将排名作为有价值的参考信息,让高校从中发现问题、找出短板、解决问题、提升自我,是学科评估应有的基本作用和功能。为了实现这一目标,一方面要求评估机构发挥自己的职能,用合法、合规、合理、合适的方法和流程,完成一次“尽心竭力”的评估工作。另一方面也要求被评估对象——大学——能以一个客观、正确的心态对待每一次评估,真正将其作为一个促进自身发展的渠道。反之,如果大学将评估及其结果当做吸引名誉、资源、知名度、地位和权利的“吸铁石”,希望通过一次评估搭乘上快速获得社会资源的“班车”,那么这种急功近利的短视心理势必会给高校带来“拔苗助长”的负面作用。因为高校如果想要获得高排名,势必会做出种种对现有学科生态系统造成破坏的行为,让“马太效应”加剧。大学一旦被排名左右,则评估立即被异化,变为大学发展的枷锁和限制。它们不再能够沉下心来为学科的发展集思广益,而是围绕着评估的指标和要求绞尽脑汁。因此,为了发挥评估的积极作用,高校要超越评估看评估,摒弃短视的评估观,通过评估结果,找到自身发展过程中存在的问题,采取适合自身特点的方法,在构建“高校特色”、“地区特色”、“中国特色”的基础上再打造“世界一流”。

对于评估方来说,在公布评估结果时,可以通过改变结果形式与公布方式的办法弱化排名带来的负面影响。比如说,不进行分档排名,而是向公众提供一份详细的评估报告[[xvi]]。如此,对高校来说,通过评估报告可以找到自身存在的问题,从而进行有目的、有针对性、有效的教学改革,即“评估后的自我反思”;对社会人士来说,通过评估报告可以更全面、更深入、更立体地了解一所大学,而不是仅仅通过一堆排列组合的数字和一目了然的名单片面地了解高校的发展情况。否则,这样一次耗时费力的学科评估,除了向公众提供学科排名结果、为学生填报专业提供选择之外,几乎没有其他方面的作用[[xvii]]

综合上述的分析,可以看出,教育行政化的思维在我国教育界不可谓不根深蒂固,它几乎存在于评估工作的方方面面。从政府公布评估工作开展开始,标准的制定、学校的参评、资料的筛选、结果的呈递……无一不透漏着大学对排名和数据的强烈渴求。甚至政府也对评估结果十分依赖,因为教育行政部门会根据评估结果完成其教育行政检查、教育成效评价与监督等工作[[xviii]],从而彰显政府的权力与职能。如果这些行政化的功利思想不能从评估工作中去除,那么其带来的负面影响将会一直持续下去,并且越来越严重。当然,任何评估方法都做不到面面俱到、完美无缺,评估本身也需要不断地发展和完善,甚至是一个长期的、非线性的、有短暂退步的螺旋式发展路径。只有在政府、高校、社会、学生等多方积极参与和反馈的过程中,学科评估和学校发展才可以逐渐趋于动态平衡,而在这一过程中,发生的一切变化都是某种意义上的“试错”与“尝试”,都在为最后的平衡状态积累经验。但无论如何,评估方和评估对象要始终不忘初心、坚守本心,而不是在花花世界中迷失了方向,被利益牵到了错误的发展道路上去。


参考文献:


[[i]]扎根中国大地开展特色评估,紧扣时代脉搏促进改革创新[EB/OL].[2020-11-03].http://www.cdgdc.edu.cn/xwyyjsjyxx/2020xkpg/zjgd/285018.shtml.

[[ii]]任中夏.英国高等教育的若干特点与启示[J]. 民族教育研究,2008,19(3):108-119.

[[iii]]张震,乔美丽,高媛. 英国高等教育评估与质量保证体系及其启示[J]. 郑州大学学报(哲学社会科学版),2006,39(4):187-190.

[[iv]]王中向.英国REF评估框架研究[J]. 高教探索,2013(4):66-69,85.

[[v]]刘莉.英国大学科研评价改革:从RAE到REF[J].科学学与科学技术管理,2014,35(02):39-45.

[[vi]]刘毳.中英高等教育评估项目比较[J]. 高教发展与评估,2011,27(5):26-29.

[[vii]]李枭鹰,唐德海. 中国大学治理的“三元文化”冲突论纲[J]. 高校教育管理,2018,12(1):84-91.

[[viii]]全国第四轮学科评估工作概览[EB/OL].[2017-12-28].http://www.chinadegrees.cn/xwyyjsjyxx/xkpgjg/283494.shtml#3.

[[ix]]汪君,周群英.卓越、公平、多元:英国科研卓越框架(REF)改革的新动向及启示[J]. 应用型高等教育研究,2021,6(2):67-72.

[[x]]教育部学位与研究生教育发展中心负责人就《第五轮学科评估工作方案》答记者问 [EB/OL].[2020-11-03].http://www.cdgdc.edu.cn/xwyyjsjyxx/2020xkpg/wjtz/285001.shtml.

[[xi]]王洪才.学科排名:利大还是弊大——对我国学科评估特征、正当性与机理的省思[J].厦门大学学报(哲学社会科学版),2019(01):78-86.

[[xii]]包水梅,黄尧尧.论我国学科评估制度改革的路径依赖及其突破[J].江苏高教,2022(04):44-51.

[[xiii]]王小梅,范笑仙,李璐.以学科评估为契机,提升学科建设水平(观点摘编)[J].中国高教研究,2016(12):23-30.

[[xiv]]茹宁,闫广芬.非学术影响评价:英国REF科研影响评估的创新性评析[J]. 国家教育行政学院学报,2020(9):24-34.

[[xv]]中国式学科评估:问题与出路[J]. 探索与争鸣,2016(9):59-74.

[[xvi]]张继平,杨丹.“双一流”建设视域中的学科评估中国化:规律、特点及路径[J]. 当代教育科学,2019(9):72-76.

[[xvii]]赵立莹.问责与改进:我国第四轮学科评估元评估[J]. 学位与研究生教育,2018(2):32-38.

[[xviii]]包水梅,黄尧尧.论我国学科评估制度改革的路径依赖及其突破[J].江苏高教,2022(04):44-51.