美育评价的元评价:含义、重心与效度

史红

摘要:美育评价需要进行含义辨析,分清是内容评价还是手段评价,底线评价还是顶线评价,事实评价还是价值评价,施教评价还是受教评价。在重心方面,应以评价能力为重,不以评价知识为重;应以评价情感体验程度为重,不以评价技术水平为重;应以情境展示评价为重,不以正规笔试评价为重。在评价方法的效度方面,提高效度的做法是量化评价与质性评价的结合,过程评价与结果评价的结合,起点评价与终点评价的结合。在美育评价指标体系的效度上,需要使用大数据技术进行美育评价,并建立完善的美育评价指标体系。

 

关键词:美育评价;元评价;评介指标;效度

对美育评价本体进行思考,即是元评价。元评价分析美育评价的科学性、合理性与价值性,体现对美育评价本身的监督机制,发现问题,及时反馈,修正调节,它影响美育评价方向和运用策略。2015年联合国教科文组织报告《反思教育:向“全球共同利益”的理念转变?》强调教育的四大支柱:学会认知、学会做事、学会做人和学会共存。根据这一报告,培养“全人”还应有“学会审美”。自2015年教育部出台《中小学生艺术素质测评办法》,明确要求艺术素质进行测评以来,依据课程标准确定考试内容,利用现代技术手段促进客观公正评价越来越受到重视。“艺术中考”是对美育的重视,对推动美育评价具有重要意义。美育评价是教育测量学对美育行为进行分析的理论建构,它是国家检验美育质量的制度性要求,也是美育改革的“牛鼻子”与“硬指标”。只有对“美育评价”本身包括评价理念、评价内容、评价方法、评价指标等方面进行深入思考,研究其中存在的问题,辨析概念、理清思路,方可有效落实。

 

一、美育评价的含义厘清

美国学者泰勒在《史密斯-泰勒报告》首次使用“教育评价”这一概念,它的目的是确定教育目标的实现程度。克龙巴赫认为教育评价是“一个搜集和报告对课程研制有指导意义的信息的过程”。斯塔弗尔比姆则把教育评价看作是“收集有关教育方案实施全过程及其成果的资料,为决策提供信息的过程”。在教育评价中主要因素是事实判断和价值判断,美国学者格朗兰德指出,“教育评价=量的记述+价值判断或质的记述+价值判断”。其中“量的记述”是量化研究,“质的记述”是质性研究,核心是价值判断。可见,国际上的教育评价经历了从“目标实现”到“助力决策”再到“价值衡定”的发展演变过程。借鉴这些教育评价概念,笔者提出“美育评价”的定义,即依据美育目标,基于全面的美育信息,根据量化研究与质性研究的手段,对美育的事实做出检验、价值做出判断的过程。美育评价特性是对与美育活动相关的各种关系、形态的把握和价值判断。美育评价目的是了解美育的结果、目标的达成情况,其准确性的高低反映出评价的效度。美育评价效度是根据评价对象做出的综合评价,检验学生审美素养的能力表现所体现的美育的适宜性与目标的吻合性。如何理解美育评价含义,我们需要厘清与辨析以下一些问题。

第一,内容评价还是手段评价。美育是美学与教育结合产生的交叉学科,是美学与教育学的向下延展方向。美育兼具美学与教育学两个学科特点。美育评价侧重评价哪一方面,是审美之“美”还是教育之“育”,这涉及如何看待美育概念。美育概念结构由“美+育”组成,美育之“美”侧重审美情感、能力、品格、趣味等内容,美育之“育”侧重教学、传授的途径、方法、工具。评价“美”,就围绕审美元素如审美情感、审美能力、审美品格、审美趣味等,进行一系列分解、细化,确定相关因子项。评价“育”,就围绕教育分解各个有关元素,如途径、措施、方法、模式、策略等。这其中反映是注重美育内容还是注重美育手段的问题。当然,手段会影响内容的实施的结果与作用。同时,美育评价也需要考虑全面性,但是评价的全面性之难也是明显的,因此,在“美”与“育”之间是做选择还是兼顾,需要统一认识。

第二,底线评价还是顶线评价。底线评价是对普通人的合格评价,其定位是普及合格率、均衡化达标率、群体测试水平。顶线评价为择优选拔,要求精确严格,定位是最高标准,为人才甄别评价。它基于分数或等级等证据,显示学生之间的发展类型和发展水平的差异性,强调标准一致性与稳定性,过程的公平性与规范性。“艺术中考”即是选拔性评价,它是常模参照性测试,主要是对比学生成绩的高低,选拔出和资源及机会相匹配的人。底线评价是顶线评价的基础,可以教育部颁发的艺术课程标准为参考。美育具有普及性质,提倡人人美育,注重人的长远、内在的审美素养发展,要求宽松。因而美育评价应是对一般的、普通的学生美育水平的检验,即使对学生进行艺术才能评价,也应以通识美育的底线为标准,而不是以最高线为标准。艺术教育有专业教育,主要培养有专业技能的艺术家;也有通识教育,主要是提高普通人的艺术鉴赏水平,而后者正是美育之中的艺术教育的意义。在美育中评价艺术技能,不能使用艺术专业教育的标准去衡量其专业程度与等级,而应该按照通识教育的要求去做。

第三,事实评价还是价值评价。逻辑实证主义认为,事实是不受意识、意志影响的一种独立存在;价值则是需要依赖于人的意识、意志反映出的判断。事实是“实然”存在,价值是“应然”存在。美育评价究竟是基于事实的评价,还是对价值的评价?事实是当下的现实与实际的“实然”,价值是内含于物的所应当具备的作用与意义的“应然”。事实具有基础性的特点,价值具有理想性特点。价值是需要在发展中不断追求才可实现的最终目标。基于现实的学校美育情况、学生审美素养的评判,即为事实评价。显然这一“实然”评价必然与理想的“应然”之间有距离。但是这也正是事实评价的意义所在,找到与价值评价要求的不足,针对缺陷进行改革,在美育过程中逐渐地接近价值目标。美育价值目标不是单一的,美育是个性化教育,在学生审美趣味、审美风格的多样化表现事实上,尊重学生审美价值多元取向。

第四,施教评价还是受教评价。现在“艺术中考”评价对象是学生,美育评价究竟应该评价什么对象,是施教的学校与教师,还是受教的学生?当然受教者的结果反映施教水平,但以怎样的要求、标准去评价施教,现在并不明确。美育评价具有导向性,导向评价学校的美育实施情况,还是导向评价学生接受美育的结果?前者引导监督学校美育质量与水平,形成对美育途径、措施、方法、手段等的检验;后者引导学生迅速提升审美素养、审美能力。施教评价是以目标实现程度为核心针对学校管理系统所做工作的评价,它使学校更多地重视美育的教学、实践、社团活动等每一环节,在途径、措施、方法、手段、模式、策略上不断改进。同时,它也是教育行政部门对学校进行美育督导的管理性评价。受教评价一方面使学生更多地把精力放在审美修养上,特别是艺术技术技巧的训练;另一方面,学生为了在“艺术中考”中获得理想成绩,也会接受校外艺术培训,迅速地提高分数。美育评价要求内容的完整、教学资源的丰富、教学目标的明确、教学手段的适用、学生的参与等,其导向会影响美育改革的发展方向,施教与受教评价应该得到兼顾,在指向受教能力提升的同时也要指向施教整体改进。

第五,美育视角评价还是艺术教育评价。采用美育视角评价的在内容上应该包括“美”的知识、情感、能力等全部内容。其中审美知识结构由美的概念、美的起源、美的历史、美的表现领域如艺术美、自然美、社会美等内容组成。作为精神实践产物的艺术是美的典型表现与突出代表,而并非美的表现领域的全部。采用艺术视角评价,是以艺术作为教育手段,侧重评价艺术知识与艺术能力,评价艺术对人的自我灵魂发现,人的感受敏锐性,人的觉醒唤起情形。艺术的确提高人的身心幸福感,提升人的情感、认知、理解、想象、创造等能力,但它是美育途径、手段、工具,是美育系统结构的单元。现在的艺术教育评价,主要是音乐、美术等艺术学科的常识、技能等测评,没有纳入自然、社会等审美内容,造成内容范围覆盖缺乏广泛性、全面性、整体性的偏颇问题。可以说,这是以“艺术教育评价”代替“美育评价”。

 

二、美育评价的重心导向

在我国,美育评价处于起步阶段,评价标准、评价程序不完善,其中有取向问题。现在美育评价存在的取向之一是管理取向,美育评价出发点是为了促进其发展,同时也以便于“开足开齐”美育课程的落实为主要考量因素,“以考促落实”,以提高管理效率为直接目标,有意识地控制评价活动的开展,追求评价的等级排序等工具性目标。从优点上说,可以督促美育落实;从缺点上说,过于强调评价标准的统一性,会忽视评价的多维性,压抑美育个性表现。之二是应试取向,现在美育评价结果的部分目的是为考试服务的,“艺术中考”,需要艺术测评的成绩。学生参加“艺术中考”是做出接受美育的资格证明,是为了入学选拔。如此,美育评价功能狭隘化,又被纳入应试教育的轨道,出现了与之相同的弊病。其三是人的需要取向,它重视所有参与人包括教师与学生等的看法,以他们的意图为基础,综合各种信息,强调在评价中应反映多元的价值观念。关于美育评价的重心问题,表现为多重的孰轻孰重的选择。

第一,应以评价能力为重,不以评价知识为重。根据美育目标,审美认知领域、审美情感领域和艺术技能领域,是美育三大领域。审美认知是对美的认识与理解,它既有一些天然认识与感悟,也有后天学习后的理解。后天审美认识基于大量的对审美知识的掌握。审美知识关涉美的历史、理念、思想、价值等内容,这些知识不具有功利价值,而更多具有精神价值。它们帮助我们建立审美态度、审美情感、审美品格、审美兴趣,其意义在于促进人审美思想和审美能力的发展。学习审美知识的终极追求是获得审美意义。美育是以美育人、以美育化人,以美树人,美育使人变成一个“美人”。美育标准以学生审美思维水平的发展为衡量标尺,审美思维水平的发展是人们审美地认识世界、探求审美意义的关键,没有达到较高审美思维水平,就无法获得审美意义。审美思维水平的发展主要包括审美思维能力的提高、审美思维品质的提升和审美态度的养成。审美思维能力的提高指人形成了较强的审美意识,审美思维品质的提升表现为人的思维的情感性、判断性、敏捷性、创造性等都得到极大发展,审美态度的养成能够使人以审美眼光看待世界、事物与人。美育目的是使人在获得审美情感、体验之后发生精神的转变、心灵的转向。对审美知识获得的评价,无法以审美知识的数量多寡作为衡量标准,而应该以人是否获得审美意义作为标准,包括审美价值、审美趣味、审美品格、审美态度等。美育知识评价是一种内隐审美接受过程的评价,审美知识是有关美是什么的知识,它不是以命题形式表征存在于大脑中的简单的陈述性知识,而是需要判断、思考、理解审美意义的知识。它涉及对审美对象“怎么办”“如何欣赏”“如何判断”的程序性知识,主要为心理操作。纸笔考试适用于审美知识检验,不能完全包括审美能力的情况,整体效度低。只有加之以审美能力检验,才能提升评价效度。审美能力是在对审美知识的学习中逐步提升的,审美能力也是审美知识积累、内化、理解的结果。对审美能力的评价应遵循突出发展性、全面性、真实性、激励性的原则,同时考虑对审美评价指标设立的完整性与清晰性。我们对审美能力的评价应进行一级指标、二级指标划分,并进行分水平能力描述。审美能力包括审美欣赏能力、审美想象能力、审美理解能力、审美表现能力、审美创作能力等一级指标。这些指标需要细分出二级指标,如审美欣赏能力分解为艺术欣赏能力、自然审美欣赏能力、社会审美欣赏能力等方面,而艺术欣赏又有音乐、美术、舞蹈、戏剧等的能力表现,审美欣赏品质涉及敏锐性、丰富性、细腻性等表现。再如想象力有创造性想象力、思考性想象力、诠释性想象力、模仿性想象力等,审美想象的品质有活跃性、发散性、多样性等表现。审美理解能力品质涉及对审美对象理解、领悟的深度、广度,以及对审美对象意义与价值的理解等。分水平能力的描述,如对美术的色彩、构图、造型、线条等的审美感觉与欣赏。这些审美能力的评价维度多、指标多、外显难,需要运用适合的、多元化的评价方式。在审美能力评价过程中,还要有前测、后测,如此才能显示出美育发展过程的最初情形以及最终结果,形成更深入、更细致、更准确、更客观的评价。审美能力评价的整体性要求我们对基础性审美能力与特殊性审美能力予以细分。同时,也可以看出学生“能力长板”与“能力短板”,发挥其长板优势,弥补其短板劣势。

第二,应以评价情感体验程度为重,不以评价技术水平为重。审美情感是人对审美对象的精神体验与反映,美育核心在于“美感”培养。王国维在1905年的《教育学》说“教育不可不以制裁下等之感情,及养成高尚之感情为务”,培养人的高尚情感,美育最为合适。蔡元培认为“美感是普遍性,可以破人我彼此的偏见;美感是超越性,可以破生死利害的顾忌,在教育上应特别注重”,并定义:“美育者,应用美学之理于教育,以陶养感情为目的者也。”可以看出,蔡元培把美育培养重点放在美感上,艺术学习也是为了提升美感。这告诉我们,美育评价主要是考察一个人的美感表现,看他审美欣赏时的愉快程度、直觉体验深度、理解复杂深度、判断准确程度、思维想象广度。这些评价是动态性评价,难以使用量化评价。如对来自对象形态、颜色、质地、声音等,使人感官舒适引起的愉悦、激动、沉醉之感,是否可以有某种量化东西用来评价内心的愉悦心情?对刘勰在《文心雕龙》里说的“形在江海之上,心存魏阙之下。……故寂然凝虑,思接千载;悄然动容,视通万里”的审美想象是否可以采用量化标尺评价?在审美体验、理解、判断、想象中,存在各种复杂的、微妙的、丰富的因素,我们只能对其中的各种心理材料碎片加以整理、分析、概括、验证、提炼、深化、升华,最终做出独特的质性评价。美感需要逐渐养成,循序渐进、次第展开,并非一蹴而就,它只能是形成性评价,是某一阶段的片段性、发展性评价。美育的目标是陶养感情,即使是学习艺术,也并非以掌握艺术技巧为最高目标。美育评价重点不放置于审美情感,而放置于技术技巧,是重心偏移的表现。学习艺术技巧是必要的,技能学习可以更好地掌握艺术规律。如学习节奏、和声、旋律、曲式等可以更易理解音乐之美;学习透视、解剖、素描、色彩,更容易理解绘画之美;学习动律、节奏、呼吸、步伐、手势是为了更好地表现舞蹈之美。必要的艺术技能是需要的,但若把艺术学习仅仅理解为艺术技能的训练,就会走入误区。另外,单纯的、重复的技术训练容易形成一种习惯,逐渐变成经验中无感的麻木状态。技术技巧训练强化的是人的工具性,而美育强化的是人的精神性。美育情感培养不能因强调技术而被轻视,也不应被技巧训练取代。

第三,应以情境展示评价为重,不以正规笔试评价为重。正规笔试建立在客观基础之上,着重考查学生对美育的理论知识的学习、掌握的情况,如音乐的基本乐理、美术的基本知识,包括历史、人物、作品、流派、风格等。这种考试以记忆性、知识性的试题为主,这类题目较为客观,标准同一,易于判断,但是一些审美情感、态度与价值观等问题难以评价,同时学生能力也无从表现。我们不能以一般知识性学习的命题形式即纸笔考试进行美育评价,而应该把审美知识放置于审美情境中,观察其运用与审美反映。作为审美行为产生的具体条件的情境展示,学生在此中的表现可以较好地展示其审美个性与特点以及与审美情境的内在关联与互动。情境评价已经成为国际教育评价的发展趋势。在美育评价中,审美情境可以是自然美、艺术美、社会美、科技美等不同情境,学生可以产生对这些情境的不同审美感受。审美情境也可以是展示空间,学生在其中表现独特的艺术才能。这一评价,关注审美知识的情境性与审美实践性价值的实现,可以调动学生的积极性,提高参与度。当然,学生即使在情境中获得较高评价,也不一定与他的能力相等。由于审美个性、艺术实践练习效应以及其他变量,学生会表现出不稳定情形。提升评价结果的有效性,就要对审美情境进行很好的设计。在情境展示方法中,评价的主观性程度较高,制定并执行统一的标准化的评价标准比较困难。另外,审美情境的设置和题目的编制难度较大,需要按照不同艺术种类进行细化,技术成本比较高。当然,现在一些地区进行的美育评价,使用的是综合性评价,有笔试,也有展示,既重知识,也重能力。

 

三、美育评价的效度问题

美育评价结果的解释是否令人满意,取决于评价的效度。效度是美育评价中心议题,作为评价结果解释的有意义性和合适性的效度,主要表现为评价目的代表所欲评价的内容和预期反应所达到的程度的内容效度。评价内容就是美育目标,预期反应就是美育结果,即学生的审美行为的确立与变化。如何把美育核心性的、关键性的要求引进内容评价中,从而提高评价效度的精确性?我们往往会在考虑内容时混淆了一些问题,从而降低了效度。内容是美育评价的焦点,被评价的学生审美表现由评估内容决定。美育评价效度以评价目的的实现程度来判断。影响美育评价效度的主要问题是内容适合性和相符性。美育应该评价什么内容,如何实施,操作方法是什么?这些来源于我们对美育理论的构想,影响到美育评价质量,也影响到美育实施,也就是所说的“评什么就教什么,怎么评就怎么教”。如果不能反映学生接受美育的情况,则美育评价是无效的。在美育评价中的效度、信度、区分度、难度四大向度中,其中效度最为本文关注。

第一,评价方法的效度。美育评价虽具有工具性意义,但是采用何种方法,还是会涉及其手段科学合理性的问题。其中,美育评价方法的功能指解决什么问题,预期会取得什么效果;作用对象指它适用于什么对象;作用媒介即采用什么工具进行评价;操作要求,则包括操作程序、技术要求;使用意图即达到什么目的。这些问题决定了一种美育评价方法的实际效果。

首先,量化评价与质性评价的结合效度高。自20世纪60年代开始,国家教育评价掀起了“社会指标运动”,多使用数据、图表与符号进行教育评价的描述,以类似分类计量、指标算度的技术化处理来建立一套语言规则,帮助做出逻辑性推论。这种科学化取向是现在国家教育评价的主要取向,它承认大数据的实证性、普遍性和确证性,并认为基于数据证据的评价工具性价值里的合理性程度高。美国教育家帕克·帕尔默说:“我们确实需要细称精量,但必须具备三个至今我们尚未具备的条件:一是我们要测量考核真正教育情境中值得测量考核的东西,死记硬背在真正的教育情境中是无足轻重的;二是我们要懂得怎样测量考核我们准备测量考核的东西;三是我们要重视那些可测量、可量化的东西,更要重视那些量化工具测量不到但同样重要或者更重要的东西。”美育内容有一些可以量化评价,有一些无法量化。量化研究是遵循实证主义原则,对对象进行数量、数据式的评价。它的前提是对象可测性。评价对象一般分为可测类与不可测两类,可测类又分为直接可测、间接可测两种。这里需要明确的是美育是否可测,若可测,为直接可测还是间接可测?若不可测,则要进行质性评价。对可测对象而言,它要具有可观察、可测量和可比较的特性,并外显出来以便判断。这即是说,要把抽象的美育评价目标具象化,使内隐的评价维度外化为显性行为,并有相对应的行为观察点。美育测量标准应是多层分级,分解出一级、二级、三级等指标,每一级指标要有行为内容与表现,美育总体行为域分解为不同维度对应的行为域。美育若是可测,其要求是测量标准必须保持恒定不变。一方面,这些指标要具有操作性,另一方面,内容范围、行为表现要有清晰界定。在美育量化评价体系中,要提炼美育观测数据点,进行评价成分、因素的分析,获得关键因变量,形成量化评价指标。应多着眼于显性的可量化因素,把复杂的审美能力简化处理,忽略某些不可测因素。量化评价的优势是能够较准确地反映美育现实,克服主观随意性的弊病,可使美育评价更加科学。这其中隐藏着科学取向的评价模式,采用实验设计思路,借用自然科学的量化方法,力图做出客观的评价。但是若片面地强调美育评价量化,一味地追求评价的精确,就会否认美育的复杂性。对适用性而言,量化评价方法适宜总结性评价,即在美育课程、活动结束后对结果的评价,以判断美育结果达到预定目的的程度,鉴定学生的审美水平高低,能力的优劣,一般使用分值、等级表述评价结果。在形成性评价中,打分不是必需的。就美育而言,审美情感具有复杂性,外显审美行为只能是作为推测内部审美状态的工具,并不能完全代表审美情感的真实的全部内容。审美素养是一个模糊量,表现为隐蔽性与难测性。我们可以运用模糊数学计算和指标定分相结合的方法,使美育评价趋于客观、真实,以避免单纯的量化评价影响学生审美能力的增长,制约学生审美行为,抹杀审美个性发展。同时,量化评价衡量是美育中的人的普遍性因素,审美个性无法量化。美育评价既要了解学生整体审美素质的高低,也要反映不同学生个体审美素质的独特之处。量化评价把抽象内容要求转为具象审美行为时,不可避免产生内蕴于外显之间的偏差,会降低评价效度。美育质性评价着重进行整体分析,透过美育外在现象,判断其内在本质。若使美育评价方法更为合理,一些可以量化评价的内容,就易采用量化方法给出准确的数值,一些难以量化的内容就采用质性评价,在有效、翔实的材料支撑基础上,采用档案袋评价、文本分析等方法与量化评价互补,对学生审美表现、能力进行更为丰富、全面的判断。在质性评价中,不讲究标准、完美典范,而应展现学生审美特质,实现个体性评价。另外,我们现在还没有成熟、公认的美育测量方法和工具,也影响到量化评价。

其次,过程评价与结果评价的结合效度高。《深化新时代教育评价改革总体方案》要求,“改进结果评价,强化过程评价”。美育“过程”是手段,美育影响是“结果”。过程看具体美育实施情况,结果是看目标实现的情况。根据“知识和技能”、“过程与方法”、“情感、态度和价值观”维度的目标体系,评价者关注学生的审美价值判断能力、审美思考能力、审美情感、审美表达能力状况而形成美育评价。它重感受、重欣赏、重表现、重创造。过程性评价主要考查学生对审美概念的分析理解,审美情感、态度和价值观的建立,艺术技能掌握等。其主要方式为审美欣赏活动、审美技能学习活动、艺术才能展示表现活动。过程性评价是由收集学生美育学习表现,对美育学习与活动经历、展示与表演的典型事例进行客观记录和写实性描述,并解释这些表现,提供反馈建议等几个步骤组成的循环。它以审美体验为评价中心,实现对美育实施与个体审美素质养成的整体观照。学生是情感、态度、价值观结合的有机体,审美认知是一种情感体验、价值判断、态度确立的综合性认识,美感是参与过程中由连续性的体验建构的。过程性评价也是动态的、开放的评价,对美育各个环节包括课程学习、课外活动、基础知识和技能、校外学习、艺术特长进行评价。现在实施的收集学生学习历程、阶段成果的“学生个人学习档案”就是过程性评价,它可以完整地、个性地评价学生的美育进展,观察短期和长期情况,分析知识、能力增长的表现。由于考试录取的特点,美育需要一个结果性评价。结果性评价是最终学生的美育素质表现,对学生进行优劣、等级的评定,给予最终分数,它表明学生的最终学习成果和课程目标的实现程度。过程评价与结果评价隐藏着因果性的时序关系,我们可以把二者作为整个评价体系的两个并列部分,并且各有不同权重比例。

现在有多省开展美育结果性评价用于中考计分,分值在10分到40分之间。如2023年无锡市采用“人机对话”的方式参加考核,从素养立意的角度考查学生音乐、美术的学习情况,命题注重生活化、情境化表述,贴近学生的认知。考生现场吹奏竖笛、唱歌,由系统识别、判分。青岛的艺术专项测试由市教育局统一命题,采用上机考试方式。由过程评价(30%)和专项测试(70%)两部分组成,总分100分。每个学生各学期艺术素质测评成绩平均值乘以30%作为过程评价成绩;专项测试题型为选择题、判断题,音乐、美术(书法)学科各50分,两科总得分乘以70%作为专项测试成绩。石家庄“艺术中考”分音乐、美术、书法。音乐考试内容为音乐素质和专长表演两项,满分100分。其中音乐素质50分,包括三项,听音(15分)、节奏(15分)、视唱(20分);专长表演50分,按专长不同选择器乐类、舞蹈类、声乐类中的一项。美术考试内容为素描、色彩两项,每项100分,共200分。书法考试内容为楷书临摹、隶书临摹两项,每项100分,共200分。可见,现在“艺术中考”艺术种类主要为音乐、美术、书法。考试类别一类是“过程评价+专项测试”,一类是“艺术素质+专长表演”。过程评价形式为“人机对话”、笔答,专项测试有音乐(听音、节奏、视唱)、美术(素描、色彩)、书法(楷书、隶书)的专业技能。虽然这些技能测试在内容上表现出了种类多元化特征,但是分数评价也表现出“唯分数论”嫌疑。过程评价与结果评价各有特点,过程评价依靠逐渐的知识积累与技能练习,所进行的是基础性、普及性、动态性评价,其中重要的是要选择学生关键性、代表性的行为进行观察,按照真实的事实逻辑进行记录。但在动态发展中过程评价的评价行为记录、材料选择、内容描述等方面,会出现资料零散、标准模棱两可、评语表述不规范等问题。如果评价标准存在模糊性的话,表现为区分度差,也会影响评价的效度。结果性评价其中隐藏的问题也是值得重视的,它较难反映学生的美育过程;较难反映学生个体审美差异;较难不增加学生技能学习的压力;较难避免学生以参加艺术培训的方式提高分值。这也反映出对美育评价的关注点何在,是关注结果评价的绝对值,还是过程评价中的增长值?采用过程评价还是采用结果评价,不是二选一的问题,而是结合的问题。究竟如何结合最为合适,需要认真思考。

再次,起点评价与终点评价的结合效度高。《深化新时代教育评价改革总体方案》说,“探索增值评价,健全综合评价”。增值就是输出值减去输入值,对于美育而言,增值评价即是把学生入学时的审美水平分成不同等级,然后根据原有水平与学习结果进行前后分值的对比,观察不同审美水平起点学生的美育增值,测量出美育目标的达成程度。学生增值幅度就是进步的幅度,使得对不同起点学生进行相对公平的评价成为可能。它评价的不同审美个性、水平的学生的效能,强调学生自身的进步幅度以及其独特的审美表现。它使用动态思维方法进行评价,引导美育从单纯注重结果到关注过程。它是对现有美育评价指标的补充和完善。当然美育增值评价也有一定困难,遗传基因对学生审美个性发展也有影响。

第二,评价指标体系的效度。美育评价指标由反映评价对象内涵的指标集及其评价标准和量化符号构成,其主体框架是指标。它取决于美育诉求,源于对学生美育结果的解构与重释。它可以评判、记录学生的美育结果,引导学生确定审美个性发展方向。美育评价指标设计的合理与否关系到评价最终效果。目前,美育评价缺乏完善的、可操作的指标体系,建立美育评价指标尤显重要与迫切。

首先,建立完善的美育评价指标体系,才可提高效度。美育评价指标级数由上往下,即从抽象、概括到具体、独特。从不同角度去看指标的性质特征,可把指标分成不同种类,如必达指标与期望指标,稳定性指标和变动性指标,硬指标和软指标。对指标分类,我们不仅可以恰当地选择某些类型指标去合理地构建美育评价指标体系,而且也可加深对某一项指标性质特征的认识,有助于评价标准的确定。美育评价标准是评价审美素质、审美水平实际达到指标程度的具体要求。达标程度可分为不同等级,不同等级有不同的评价标准。在美育评价指标体系中,末级指标必须明确规定评价标准。从评价内容上说,是一种状态标准与效果标准。构建美育评价指标体系主要问题是信度与效度,它们是构建质量的重要尺度。从信度上说,同一评价者运用同一美育评价指标体系去重复评价某一对象,考察所得结果的一致程度,为重评信度。在短时间间隔内实施两次或以上,评价结果越接近,则信度越高;相差越大,则信度越低。不同评价者运用同一种美育评价指标体系去评价同一对象,考察不同评价者所评出的结果的一致程度,可称之为评价者信度。同一评价者使用两种美育评价指标体系,评价同一对象,考察两个指标体系所得结果的真实程度,可称之为事实信度。越贴合实际,信度越高。要提高信度,需要指标内涵具有客观性,指标与指标之间界限清晰,硬指标比例大,标准明确。美育评价指标效度是指评价指标、评价标准、评价的量化符号等元素设计的准确性和代表性。这考察的是美育目标与评价指标体系的契合关系,两者愈吻合,说明评价指标体系元素的设置愈准确,愈有代表性,此为效度高。若美育评价指标设置不合理,指标权重分配不严谨,评价标准不科学,等级赋分不恰当等,就会降低美育评价指标体系的效度。提高美育评价指标体系效度的关键是科学地逐级分解评价对象,这取决于对评价对象内涵理解的程度。如把“审美情感”这项评价对象分解为若干细项指标,需要了解美学理论里关于“审美情感”的本质、特点、层级、表现等,才可逐级分解。当然对评价对象内涵的理解是多元的、丰富的,在多项指标中,应选择最重要的指标。同时,还需要知晓实施评价指标的主观和客观条件的可能性。

其次,使用大数据技术进行美育评价,才可提高效度。要使美育评价方法发挥预期效果,就要处理好方法的工具价值和美育内在价值的关系,使其与评价目的相一致。美育评价目的是提高学生审美能力与创新精神,使用纸笔测验方法显然就不能完全达到目的。从教育评价发展历程来看,已经经历过四代评价理论的发展,即心理测量,以测量结果的客观性与标准化为主;数学矩阵,在数据显示的目标矩阵和结果矩阵之间进行同构描述;价值解读,对客观事实与主观标准进行价值判断;积极建构,评价主体进行共同参与、协商。相应的,在方法与手段上,教育评价过程表现为从工具性“量表测验”扩展到多元化的“档案袋”建立,包括观察、问卷、访谈、记录、收集作品,再到现代的智能化的“大数据”挖掘、精准测评、深度反馈的数据技术的使用,教育评价越来越向现代化、智能化方向发展。美育评价方法与信息技术的深度融合,并向智能化看齐,引领美育评价的“智慧运行”,成为难以阻挡的时代趋势。若提高美育评价中的效度,就需要利用大数据技术,对学生数据进行收集、归档编码、挖掘探索、精准计算、深度分析、反馈对象,实现评价结果的正确判断。同时,立足于审美知识内容、思维过程、能力发展的内在统一,大数据技术也展示出与审美素养的复杂程度相适应的要求与特点。把大数据思维运用于美育评价,强调考虑美育评价数据的整体、总体;考虑数据来源可靠、真实;考虑数据量与质的逻辑关系。它要实现的是美育评价效度的最大化与最优化,最大化体现为美育评价的全方位性的数据搜集、全员性的主体参与、全面性的督导监测;最优化体现为数据筛选至最佳,判断分析至最精准,反馈报告至最显个性。使用大数据手段对学生进行“图谱式美育评价”,绘制“审美能力图谱”,可以全面地把握学生审美知识与能力表现状态,提供相应的证据来展现学生审美上的优势与弱势,包括审美知识、兴趣、情感、能力等多方面的综合描述。这种评价方式可以说是学生审美素养与能力的画像,它突破了以分数单向度描述学生审美素养与能力的局限,在内容上体现评价的有效性,把学生作为评价主体,关注他们的审美情感、心理、体验,以及审美个性。

四、结语

美育评价的意图不是为了证明、比较,而是为了改进、发展。它以现实为基础,不断接近理想目标,以促进美育发展为目的,观察美育目标所达到预期效果的程度,做出价值判断。美育评价的目的在于促进质量的行动,即提高美育质量的政策行动、教学实施行动等。希望我们的美育评价可以越来越科学、规范、有效。