巫锐陈洪捷质量何为德国学术评价机制转型

DOI:10./j.cnki.-..01.13

摘要

21世纪以来,为破除“唯论文”,德国科学基金会和科学理事会牵头,倡导“质量而非数量”学术评价机制转型。在改进“评价方法”上,注重发挥同行评议基础性作用;针对量化指标,建立专属性认知与应用体系,明确其对同行评议的支持性作用。在拓展“评价内容”上,强调学术能力综合评价,尤其注重科研领导与合作能力,兼顾个体学术职业发展状况。德国学术评价机制转型对我国的启示是:加强对不同评价方法功能与问题的认识,是学术评价机制转型的基本前提;在操作层面实现“统计有度”和“比较有方”,是学术评价机制良性运转的重要保障;基于学术系统复杂性和多元性特点,学术评价机制的完善要以健全学术系统为总体目标。

关键词

德国;学术评价;方法;转型

一、问题的提出

  学术评价机制是学术系统的重要组成部分。随着新自由主义理念的全球扩散,以绩效为导向的高等教育调控政策,一定程度导致学术评价过分偏重量化指标。追求卓越和效率的审计文化使得教师考核标准单调化,缺乏学术评价整体设计。我国建设一流大学,非常看重论文成果。成果固然重要,但如果以“数量至上”,既违背知识生产规律,又容易造成学术不端。针对高校教师评价工作中“唯论文”现象,年2月,教育部、科技部印发《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》,要求“探索建立科学的评价体系,引导评价工作突出科学精神、创新质量、服务贡献”。同年12月,教育部印发《关于破除高校哲学社会科学研究评价中“唯论文”不良导向的若干意见》,指出“要深刻认识‘唯论文’现象的系统性危害”,要求“进一步健全中国特色哲学社会科学学术规范和评价体系”。为将该要求落实落细,需要在方法和内容层面,探讨合理有效的学术评价机制。

  作为现代大学制度发源地的德国,也经历了学术评价机制转型。自20世纪80年代以来,德国学术工作环境发生了“本质性变化”,这导致诸多关于学术评价的争议。随着政府缩减基本财政拨款,第三方经费越来越成为一种补偿,同时也变成了一项重要绩效指标,其分量在德国科学体系的所有领域显著增长,因为这直接影响高校绩效性财政拨款额度;此外,大学排行榜和评估程序盛行,强化了德国学术体系中以指标为导向的绩效竞争。随着指标化绩效评估体系的建立,特别是21世纪以来,文献计量在科研资助分配和学术评聘中发挥明显作用,德国一度陷入“发表洪流”(Publikationsflut)。相应地,学术发表沦为机会主义者的工具,如将科研成果拆分成“最少可出版单位”(LeastPublishableUnit);隐去互相矛盾的数据,或者不公布“消极的研究结果”;降低对研究结果“可复制性”要求。还有学者指出,论文被同行拒绝后,其核心观点“及时地”出现在他人文章中,这揭露了“同行剽窃”可能性。由此,学术讨论文化变得不再公开,申请第三方经费压力增大,青年学者处境愈发糟糕,而“追求成功的压力”容易导致学术不端。

  为扭转这一局面,德国最大学术资助机构,即德国科学基金会(DeutscheForschungsgemeinschaft),和德国最权威科学政策咨询机构,即德国科学理事会(Wissenschaftsrat),发出了“质量而非数量”学术评价转型倡议,从评价方法和内容两个维度,提供了精细化操作意见,旨在扭转“唯论文”不良导向。同时,各高校在教师评聘中也有相应实践,共同推动了学术生态体系良性运转。基于此,本研究   (一)全面改进学术评价方法

  德国学术评价机制转型的首要措施是全面改进学术评价方法。“不唯论文”并非“不看论文”,而是用合理方法使用“论文数量”和“评价论文”。德国的做法是发挥同行评议的基础性作用,并完善具体程序;针对量化指标,建立专属性认知与应用体系,明确其对同行评议的支持性作用。

  1.发挥同行评议的基础性作用。同行评议(peerreview)作为一种具有主观性特点的学术评价方法,被认为最早出现于英国皇家学会(成立于年)会刊《哲学学报》(PhilosophicalTransactions)的审稿程序中。后来,这一方法被广泛地运用于各学术评价领域。无论是对于期刊文章评审,还是在科研资助分配或学术招聘程序中,同行评议作为“学术界内部一种制度化的自我控制”,最有可能判断研究质量,也最契合科学研究的多样性和复杂性。由此,在学术评价机制转型中,应发挥同行评议基础性作用。

  然而,同行评议有明显缺点:第一,由于缺乏协调,不同评估程序时间间隔太短,且支持同行评议所需资料(包括机构提供的资料)常常难以统一,负责机构需要承担很重负担;第二,由于管理服务很难跟上,评审工作量总体分配并不均衡,这会导致一小部分专家承担过重评审任务;第三,同行评议易受个人和机构声誉的影响,评审有时也倾向于在判断中引入自身在题目和方法上的偏好,且易受群体压力影响,往往得出同质化判断,这会导致研究者偏重学术界主流题目,阻碍创新研究。

  基于以上问题,德国的做法是从三个方面改进同行评议。首先,由于同行评议动用大量资源,在采用此方法时,组织方应充分说明理由。通过此程序旨在让负责机构认识到组织同行评议的必要性和可行性,以便做好准备工作。其次,同行评议与其他评价方法一样,存在缺陷,应反思评审程序并做好质量保障工作。在选择评审时,注重组合多样性,特别是纳入国际评审和青年学者。最后,评审须对同行评议风险保持足够警觉,包括偏爱主流题目、群体压力影响等。由此看来,尽管同行评议是从定性角度评价学术工作的基本方法,但使用者须对这一方法的风险保持高度警惕,而评审的选择与组合则是保障同行评议质量的关键要素。其中,德国科学理事会专门强调,同行评议应纳入不同职业发展阶段的学者,特别是青年学者。这有利于实现评审任务的合理分配,保障评审成员拥有充足的评阅时间,以提升论文评审质量。对青年学者而言,也能通过评审工作获得学习机会,以更好融入学术共同体,这有利于提升同行评议的整体质量。

  2.建立量化指标的专属性认知与应用体系。在学术界,竞争并非新出现的现象,一直以来就存在围绕知识高峰、教职岗位、学派建设以及学术声誉的竞争。21世纪以来,量化指标在学术竞争中发挥了明显作用。然而,以数量为衡量标准会给学者带来大规模发表压力,并不能为评估高质量学术工作提供适当基准。同时,科研活动数量增长,存在“边际效应递减现象”,这并不一定带来所期待的学术质量。

  为避免“量化崇拜”,德国的做法是,针对量化指标,建立专属性认知与应用体系。这一体系具体包括五类量化指标,(见表1)并细分了文献计量指标。(见表2)结合表格内容,每项量化指标都有固定功能,且存在不同问题。其中“发表物数量”能一定程度反映研究者生产力水平,但会刺激“更多发表,而不是传递必需的科学认知”。由此,应明确量化指标对同行评议支持性作用。如文献计量指标只能用于同行评议,其功能是为同行提供信息支持。此外,针对文献计量指标中“发表物数量”,应尊重不同专业发表实践与文化,兼顾专业领域“平均值”。

在科研评审环节,尤其容易过分   (二)综合拓展学术评价内容

  除全面改进评价方法外,综合拓展学术评价内容,也是德国破除“唯论文”的重要保障。其核心是,扩展“学术成绩”概念,除知识生产外,强调“科研服务”重要性,如主持科研项目、科研基础设施建设、主编出版工作、学术委员会工作等。年,德国科学基金会结合“良好学术实践”倡议,提出评价学者表现的“多维方法”,即“成果评价首先基于质量标准,而数量指标则视具体情况和经甄别后才能计入整体评价中;除《普通平等待遇法》中规定类别外,若自愿说明,简历中反映的个人特殊情况也被纳入评估过程”。

  针对多维学术评价,基金会提供了具体参考项目。首先,高质量学术工作以学科标准为基础,应考虑各学科特点与传统。其次,除知识生产外,学术评价还包括对教学、学术自治、公共关系、知识和技术转让的贡献,对社会整体利益的贡献,学者学术态度(如认知的开放性和风险承受度)。此外,因个人、家庭或健康状况而耽误的时间,或由此导致培训延期、选择其他职业等,应在评估中予以考量。可见,这一多维方法倡导了学术综合评价,除强调学术工作知识价值外,还突显学术工作社会价值。同时,学术评价兼顾学者个人职业发展状况,反映出对个体需求的尊重。

三、德国高校学术评价转型的具体实践

  在德国学术评价转型中,高校作为学术团体重要成员,在德国科学基金会和科学理事会指导下,也有相应实践。德国高校联盟(DeutscherHochschulverband)主席波尔哈特?肯彭(BernhardKempen)指出,自科学基金会采取措施阻止“发表洪流”以来,“现在该轮到高校采行动了”,而其中一项重要措施是,改革学术人员评聘规章,“否则所有人都在写,但几乎没有人会读”。下文以德国高校学术人员招聘,特别是终身职位聘任规程为例,从方法和内容两个维度,梳理德国高校破除“唯论文”具体实践。

  (一)优化定量与定性评价具体操作方法

  与德国科学基金会和科学理事会的思路一致,为避免“唯论文”,必须优化使用“论文数量”这一评价指标,而非将其完全摒弃。在学术人员招聘程序中,德国高校首先明确了文献计量指标的合理使用方法,具体表现在两个方面。

  第一,采用“以博士论文为起点”和“时间间隔”计算方法,实现文献指标统计“相对化”。杜塞多夫大学招聘指南强调,在统计发表物数量时,以获得博士学位时间为起点,计算每年发表物数量。此规定表明,学术评价始于博士生“出师”之时,并强调逐年积累学术成果的重要性。耶拿大学在招聘规程中指出,“资深者往往留下发表物多的印象,这不应给青年应聘者造成负担,应根据‘时间期限’衡量科研成绩”。第二,不单独使用文献计量指标,应聘者在填报“论文数量与名称”时,须说明论文内容,而评审则以博士论文为参照,评价其整体科研成绩。斯图加特大学在终身教职聘任规程中指出,除注重方法论基础和创新特质外,还要“与博士论文相比较”,评价“科研工作的拓展性和创新性”。马格德堡大学在终身教职聘任规程中采用了同样方法,除   可见,在使用文献计量指标时,除通过“以博士论文为起点”和“时间期限”来优化统计方法外,还要求“与博士论文相比较”,建立参照系,以实现“比较有方”,这进一步明确了定性评价的基础性地位。同时,优化定性评价操作方法,尤其是完善评审回避条件,是保证评审公平公正的关键。以波恩大学为例,其招聘指南规定了回避情况,包括曾作为专家参与候选人的博士或教授资格评审,或存在亲属关系,或与候选人存在职业关系或上下级关系。以马尔堡大学为例,在选拔评审时,须避免以下情况:①在学术考试程序(博士学位、教授资格)中担任过候选人导师;②目前与申请人受雇于同一所大学或专业领域,或过去三年与申请人受雇于同一所大学;③在过去三年内与申请人共同发表过文章,或共同开展科研项目;④候选人的委任直接影响评审或其同事的职位或职能,或者评审与候选人之间有竞争关系;⑤如果(根据现有“学派”发展情况)评审明显属于另一种理论方向,这可能造成负面评估。可见,评审回避条件非常复杂,不同大学有不同规定,除师徒关系、工作关系或亲属关系外,还需注意学派关系、学术合作关系等。

  (二)注重学术能力综合评价

  为破除“唯论文”,须拓展学术评价内容。与德国科学基金会“多维方法”相一致,在高校招聘规程中,一个明显转向是,实施学术能力综合评价。以耶拿大学招聘规程为例,在“候选人选拔”章节指出,“质量和原创性,而非数量,在确定人选中起决定作用”;除学术发表外,给予科研合作能力、科研领导能力等适当权重。斯图加特大学终身教职聘任规程也体现对学术能力综合评价的重视。如要求应聘者提供不超过10页的职业自述报告,其中除填报发表物和第三方经费数量外,还要描述校内团队科研合作,区域性、国家与国际科研合作和跨学科合作”。以上评价维度不仅反映出对整体科研生产力的兼顾,而且注重除生产性指标之外的其他重要学术能力,特别是科研合作与领导能力。

  当然,由于大学科研实力和规模不同,围绕综合评价的相关规定也有差异。与以上两所高校相比,凭借雄厚实力入选德国“卓越大学”的柏林洪堡大学,不仅增加了判断发表物质量的方式,而且更详细定义了各项维度,这具体表现在:第一,注重与专业相关、具有实质性个人贡献的发表物质量,必要情况下可考虑数量;在提供发表物时,需说明研究问题深度和广度,长期研究项目方法论基础、创新性以及对研究领域贡献,出版物接受与评价情况。第二,强调建立与维持科研合作的重要性,包括与其他大学机构、校外研究机构合作以及国际合作,参与研究项目或担任发言人、组织跨学科专业会议、组织或参加国际性专业会议等。第三,   此外,德国高校在学术评价中还强调对学者个人诉求的尊重,这有利于在招聘程序中保障机会公平。以慕尼黑联邦国防军大学为例,其招聘程序指南专门提及“下列标准不得对学术资格的评价产生不利影响”,这些标准包括因护理或养育子女而中断工作、缩短工作时间或延迟完成个人培训课程,由于照顾儿童或有护理需要的人而造成的时间限制,因家庭原因中断学业或推迟资格认证,因残疾、慢性病或长期严重疾病造成的延误或中断。

四、结论与启示

  为扭转“发表洪流”,德国科学基金会和科学理事会推动了“质量而非数量”学术评价转型,各高校在学术评聘中也有相应实践。总体来看,德国做法是,发挥同行评议基础性作用;针对量化指标,建立专属性认知与应用体系,明确其对同行评议的支持性作用。在内容上,强调学术能力综合评价,尤其注重科研领导与合作能力,兼顾个体学术职业发展状况。德国学术评价转型理念及操作方法,可为我国探索建立科学的评价体系提供如下启示。

  首先,加强对不同评价方法功能与问题的认识,是学术评价机制转型的基本前提。在扭转“发表洪流”的实践中,往往容易从一个极端走向另一个极端,如立刻取消针对论文的奖励措施,或者凡事都讲同行评议。同行评议与量化指标作为学术评价的基本方法,各有优劣。在使用过程中,不能简单地用一种方法否定另一种方法。量化指标能一定程度反映学者在固定时段内的学术生产力,但并不能成为衡量学者学术水平和预测其未来学术成绩的绝对标准,而且量化指标很容易被操作,导致学术发表泡沫。对此,德国经验是,针对量化指标,建立专属性认知与应用体系,更多发挥量化指标信息支持功能。相较而言,同行评议最有可能判断论文质量,也最契合科学研究多样性和复杂性,但应对其风险保持警觉,特别是容易偏爱主流题目或受群体压力影响。对此,德国的经验是注重评审组合的多样性,特别是纳入国际学者与青年学者,同时细化回避原则。

  其次,在操作层面实现“统计有度”和“比较有方”,是学术评价机制良性运转的重要保障。破除“唯论文”,并非不看“论文”,而是更好地使用“论文数量”和评价“论文内容”。对此,德国的做法是,强调“博士论文”的重要参照功能。如采用“以博士论文为起点”和引入“时间期限”的计算方法,实现文献计量指标比较的“相对化”,这有助于做到“统计有度”。同时,在同行评议中,不单独使用文献计量指标,而是要求申请人说明科研成果的内容,包括研究问题的深度和广度、方法论基础等。为实现“比较有方”,评审应将申请人填报的整体内容与其“博士论文”相比较,以判断学术工作的拓展性与创新性。

  最后,学术评价机制的完善要以健全学术系统为总体目标。评价机制改革不能只



转载请注明地址:http://www.jiangwangfei.com/wqzp/8451.html
  • 上一篇文章:
  • 下一篇文章:
  • 热点文章

    • 没有热点文章

    推荐文章

    • 没有推荐文章