期刊大全 杂志订阅 SCI期刊 投稿指导 期刊服务 文秘服务 出版社 登录/注册 购物车(0)

首页 > 精品范文 > 教育测量与评价论文

教育测量与评价论文精品(七篇)

时间:2022-02-27 03:38:40

教育测量与评价论文

教育测量与评价论文篇(1)

关键词教育测验教育测量教育评价

教育评估、教育评价是20世纪30年代在美国兴起,60年代兴盛于西方世界并传入我国。这些学科虽然在我国大力已有20余年,但

的进展不大,学科的成熟度不高,与我国广泛开展的教育评价活动很不适应.我国各省市都有院(中心),也成立了许多评估、评价机构,广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟.尤其值得重视的是教育评价与教育研究和发展,以及对教育评价实践的指导.鉴于此,本文对与教育评价相关概念进行简述和辨析.

一.关于教育评价相关概念简述

教育测验:即为考试,它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统,它由主考、

被考(考生)、试卷(试题的集合及其评分标准)、考分四要素组成。考试的过程就是主考组织编制试题,通过试题作用于被考,将正确答案、评分标准与被考的反应(答案)相比较,然后给出考分的过程。考试从宏观上可分为考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用,可分为常模参照性考试和标准参照性考试。按考试对象分,有学业的成就考试、学术能力倾向测验(其目的在于测量考生的潜在能力、发展倾向,如能力倾向测量)、人格测验(如测量态度、兴趣、情绪、性格等).按测验人数分,有个别测验、团体测量.接测验方式分,有纸笔测验(用笔时试卷作答)和非纸笔测验(如口试、实验操作、表演等)。其它可分为难度测验、速度测验、性测验、诊断性测验以及大规模测验(其成绩的使用有权威性,要求严格,标准化程度高)、教师自编测验(即教师自编用于课堂教学的测验)等.[1]

教育统计(学):运用数理统计学的原理和研究教育现象中的数量关系的一门学科。它通过数据的和处理,准确地掌握教育

情况,为制定教育方针、政策提供依据,为开展教育科学研究,探索教育,制定教育方案,检查教育效率提供科学方法,也为教育管理和教育评价提供有效的工具.它分为两大类:一是描述统计学,研究简缩数据和描述这些数据,二是推断统计学,用数据进行统计检验,统计分析和非参数统计法作出决策。前者只是分析某一样本的特点,而后者则是通过抽取母体的一个样本,并以此样本为根据来分析母体的特点.它是在教育的研究中,描述样本,分析样本,分析样本与总体的关系,从而进行教育科学推论的一种原理和方法.其研究方法一般有:大量观察法、统计分组法、综合指标法、统计资料检验法、统计资料图示等。[2]

教育测量(学):研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具,根据教育目标或教学计划的要求,研究如何测量和评价教育效果,如何编制测量计划,各种类型试题的优缺点,衡量一个学业成绩测验好坏的数量指标,如何进行测验结果的统计分析,测验分数的解释和评价等.其主要包括:测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估:是一种有系统地去寻找并搜集资料,对评估对象作预测性、估计性的评判,以便协助教育决策者从若干种可行的策略中择一而

行的过程.在我国教育评估与教育评价不作严格区别,在实践中具体运用时,不同的范围和场合有不同的习惯用法.如高等教育中多用评估,在督导部门也称督导评估,而在普通教育领域多用教育评价不过两个概念是有一定区别的.评估有估价的含义,较为模糊粗略,而评价相对而言是较为精确的价值判断,评估多用于群体或单位的状态及效果的估价,而评价则既有对群体和单位的价值判断,也有对个人的判断.教育评估的一个重要目的就是为教育决策提供重要依据,国家教育管理部门要根据教育评估的结果,及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料,而不是行动纲领.[4]

教育评价(学):以教育为对象,研究各类教育目标与相应的教育现象之间的关系,并给予一定的价值判断的学科.它的研究范围可划分

为:宏观教育评价(研究教育思想评价和教育制度评价)和微观教育评价(研究学校教育系统内部各类教育思想和教育活动的评价,如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等)。它的基本范畴是:教育评价的对象,教育评价的范围,教育评价的模式,教育质的规定性评价,教育量的规定性的评价,教育质和量变化的度的评价,教育评价的指标体系,教育评价的类型.其研究的基本原则有:客观性原则、理论联系实际原则、发展性原则和联系性原则.其种类包括目标评价、过程评价、条件评价、贡献评价等.[5]

教育评价(学):教育评论学是研究教育评论现象和教育评论活动规律的科学.或者说它是研究教育评论的、现状,教育评论现象的

本质联系,教育评论工作的性质、任务和作用,以及教育评论工作的原则、方法的科学.教育评论学是与教育理论、教育史并列的一门教育学科.要建立教育评论学的学科体系,必须解决两大难题,即建立教育评论学的范畴体系和概念体系,并给予科学的揭示和阐述,使这些概念和范畴形成一个有机整体.同时,还要运用这些概念、范畴及其所固有的内在联系,采取科学的方法论证教育评论活动中最普通、最一般的科学原理;从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务,从根本上规定了教育评论学的学科性质和范畴.首先,教育评论活动是一种教育科研活动,它的直接结果是鉴别、评判教育文化的优劣,进而对教育界产生社会舆论导向作用;而教育文化本身及其所产生的依附于受教育者身心的精神产品,都属于意识形态范畴,可见教育评论家属于研究意识形态和揭示教育评论活动的本质规律,建立完整的教育评论学学科体系。所以,教育评论学也属于基础理论学科。再次,教育评论学的研究对象决定了教育评论学涉及整个教育领域,内涵十分丰富。也可从不同视角,针对不同范畴建立多部门、多层次的分支学科(如:教育理论评论学、教育史评论学、教育行政评论学、教育家评论学等),所以教育评论学又是一门综合性的学科[6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系:教育测验是对人的知识、技能和能力以及其他某些心理特征的检测,是教育评价的一种手段,确切地说它是

教育评价获得评价信息的工具之一.教育评价获取信息的测验法就是来自于教育测验.

教育评价与教育统计的关系:教育统计是运用数理统计的原理和方法研究教育现象中的数量关系,通过数据的分析和处理确切地掌握教育

情况,也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系:教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定,为教育评价提供依据,是教育评价信息的主要来源.如果没有教育测量提供的资料,教育评价将成为无源之水,失去了作价值判断的依据,其科学性、准确性便无从谈起。另外,教育测量的结果只有通过教育评价才能获得实际意义,成为改进教育工作有价值的信息.[7]

教育评价与教育评估的关系:教育评价与教育评估是非常相近的两个概念,在许多场合是通用的。评价是精确的价值判断;而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著,以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面,对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系:教育评论是对教育文化的反思和展望,它的对象是以教育文化中的精神文化和制度文化为主的,以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差,但它与教育评价分属于教育科学的不同领域,有着重大区别。比如,教育评价是一种管理活动,而教育评论则为观念活动;教育评价由评价机构按严密的程序实施,而教育评论则由教育评论家个人采用灵活多样的方式方法评述;教育评价有明确的指标体系并要求量化,而教育评论无需指标体系更不用量化,教育评价的对象是具体的可控的,而教育评论的对象是抽象的,不可控的;教育评价的结果多用于改进工作,而教育评论的结果则多用于改变观念;等等。这不是说教育评价与教育评论一点关系都没有,它们的关系表现在教育评价的结果可以成为教育评论的论据教育评论,而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与评价相关概念的区别

唯物主义的价值论认为,价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和为对象的,它探讨客体“是怎样的“、”是什么“,探讨事物的现象、本质和规律等实体属性,即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象,它探讨客体的价值属性,即客体的意义------对社会需要意味着什么,它以多种意识形式-----认识(价值与事实判断)、情感(对价值的态度体验)、意志(对价值的自觉保证)等诸种形式的综合来反映客体与主体需要的关系。

从前面的可以看出,教育评价对评价的对象不仅要借助教育测验、教育统计、教育测量进行量的测定和分析,而且要进行质的分析,

把所有考查绩效的材料和分析综合起来,在多大程度上达到了预期的目的作出价值判断。从这里可以看出,教青评价行为是建立在事实判断基础上的价值判断.教育评价中的事实判断在于诊断与鉴别教育的性状,价值判断则是对诊断鉴别而得的结果或结论,按其价值取向进行合乎目的的推断和判断;事实判断是价值判断的基础,价值判断是事实判断的目的性追求。而教育评论是依据一定的教育价值观和教育价值取向,对教育的一种价值判断。从教育测验到教育评论是一个由事实判断向价值判断的变化过程,我们不能说教育测验丝毫没有价值判断,如在测验什么不测验什么的上是有价值判断的;同样,我们也不能说教育评论就无点滴的事实判断,教育评论需要通过事实判断的真凭实据作论据。

四、对教育评价学及其学科群的建议

教育评价学经过几十年的已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。与此相应的考

试学(研究教育测验的学科)、教育统计学、教育测量学、教育评估学、教育评论学都已有相应的发展,形成了一个共生的教育评价学科群。21世纪,要使这个学科群得到良好的发展,我认为首先对各个学科的研究范围有个明确的划分,尤其是对教育评价学要有合理的定位,不要再把学、教育统计学、教育测量学的纳入自己的努力范围,要让它们以独立的学科更好地为教育评价学服务。另外,教育评价学还要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展.同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科.其次,各学科要明确自己的研究对象,形成概念体系和学科体系,把一些已成熟的概念和约定俗成稳定下来,逐步形成相对稳定的学科知识和概念体系。第三,要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极实践经验并升华为新的理论,丰富和发展教育评价学学科体系.第四,要处理好引进与消化吸收的关系问题。无论是从国外引进的教育评价学理论,还是从教育界以外引人教育的评价理论都要结合我国的教育理论和教育实践,进行修正使其“本土化”和“教育化”。

综上所述,搞清教育评价相关概念的关系,对理清教育评价学科群内各学科的关系,促进该学科群的发展,为丰富和发展教育科学,加快

教育事业的发展有重大的理论和实践意义。

[1][5]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页、第167页

[2]参见曹延亭编著·《教育统计学基础》·辽宁人民出版社·1984年版·第2--5页

[3]见李冀主编·《教育管理辞典》(第二版)·海南出版社·1997年版·第216页

[4]参见许茂祖编著·《高等教育评估理论与》·铁道出版社·1997年版·第16--27页

[6]见刘尧著·《教育评价学》·中国文联出版社·2000年版·第7--23页

教育测量与评价论文篇(2)

关键词:中职教育;教学质量;评价

职业教育的质量问题是我国职业教育内涵式发展的内核,针对教育教学质量的评价则是对教育起点、教育过程以及教育结果的信息搜集、分析、诊断与反馈,能够有效保障并提升教育教学质量。当前在我国的中职教育教学质量评价中仍然存在不少问题,这在很大程度上制约了职业教育的现代化发展,影响了职业教育的地位和吸引力。然而,中职教育教学质量评价是一个极其复杂的理论与实践体系,其中涉及了诸多因素、线索与层面,现以学生发展为主视角,对中职教育教学质量评价的特征、指标以及实施等问题进行粗浅思考与剖析。

一、中职教学质量评价存在的问题

(一)评价特征不明显

中职学校的教学质量评价理应关注中职教育人才培养的目标要求,体现中职教育的类型特征。但在实践中,不少中职学校受传统思维影响,在中职教学质量评价的设计与实施过程中,常常与普高教学质量评价混为一谈,无法从本质上凸显中职教育教学质量评价的内在特征。即便部分学校在教学评价方面做了职教特征设计,也往往只是形式上的表征,并没有真正触及职校学生发展的内核,故而无法真正发挥教学质量评价对于职业学校人才培养的作用与功能。

(二)评价标准不清晰

教学质量评价的有效性应建立在一套清晰的评价标准之上,但调查发现,当前在部分中职学校中,一定程度存在教学质量评价标准不清晰的问题。具体表现为:第一,标准制定缺乏科学依据。在评价标准制定过程中,常常根据领导意志或凭借经验随意制定标准,与教育研究机构组织的专业评价联系不多,与行业企业的要求相差较大;第二,标准内容缺乏核心指标。标准内容的目标指向不明确,看似面面俱到,实则泛泛而谈,缺乏具有支持学生发展的专业学科特色的核心指标;第三,标准水平难以评测。大量的评价标准停留于模棱两可的描述层面,没有达到可操作的量化水平,致使评价人员只能凭主观判断。

二、教学质量评价的核心指标

中职教学质量评价问题的消解,关键在于对教学质量内涵的准确理解,并据此确立一种复合型多层次的教学质量评价标准体系。在现代职业教育理念的关照下,以中职教育培养目标为基础,中职教学质量应具备的基本特征为:其一,基础性与专业性兼容,在为学生提供一定宽而深的文化知识基础的同时,关注对学生的专业教育,实现人与社会职业的有效链接。其二,理论学习与技能实践并重,加强学生实践教学和技能训练的同时,更应重视学生的理论学习,帮助学生锻炼思维能力,提炼实践经验,满足现代行业企业对复合型人才的素质要求。其三,人的发展与职业适应相契,以人的职业适应为基础,完善人的发展,关注人的生命价值,追求人的幸福。围绕上述中职教学质量的三大特征,提出相对应的以“文化基础—专业知能—职业素养”为基本维度的教学质量评价标准体系,该体系以学生基本素质为基础标准,以专业能力为核心标准,以职业素养为职业发展的价值标准,并在此框架下设计各维度的下属指标及其表征、权重。

(一)学生基本素质

根据中职教学质量的基础性特征,评价学生发展的基础维度应是基本素质,这既是学生发展专业知识和技能的基础,也是学生终身学习、终身发展的重要基础。根据人的全面发展理论“,基本素质”维度下属指标具体分为:身心素质———指学生在身体、心理方面所具备的良好素质,拥有健康的体质条件、一定的运动能力以及正常的心理状态,这是一个人全面发展的基础之基础。道德素质———指学生在思想、政治、道德等方面所表现出来的符合一定的社会要求与规范的特点和倾向,具有高尚的道德情操、良好的个人修养以及端正的行为品质。智力素质———指学生在语言文字表达、逻辑数学运算、视觉空间觉察等方面的能力以及一定存量的人文科学知识基础,这是学生发展必要的知识文化基础。情感素质———指学生在情感态度等方面所具备的基本素质,比如在艺术欣赏、情感表达、情绪管理、人际沟通等方面拥有较好的素养。实践素质———指学生在动手操作实践、参与社会活动等方面具备的基本能力。

(二)学生专业知能

从教学质量的专业性特征来看,学生的专业知能就是评价教育教学质量的核心维度,依照“理论学习与技能实践并重”的基本特征,该维度可进一步分为“专业知识”与“专业技能”。由于受到不同专业特性的限制,因此在专业知识和专业技能的具体结构、内容以及水平方面,需要结合具体专业要求设计。以“中职学前教育专业”为例,要求学生在专业知识结构方面具体掌握:学前教育学科的基本知识,主要包括学前教育学、学前心理学、学前卫生学等;学前教育学科专业知识,主要包括了《幼儿园教育指导纲要》涉及的“健康、科学、语言、艺术、社会”五大领域的专业知识;学前教育学教学的基本内容;幼儿园管理的基本知识。在专业技能方面,要求学生具备以下几个方面:教育教学技能,即指组织开展课堂教学活动的能力;实践操作技能,即在弹、唱、跳、说、画、演、做等方面实践和创编技能;幼儿保育管理技能,能够对幼儿进行日常保育、管理、沟通的技能;幼儿园活动设计、实施的技能;与家长交流合作的技能;以及开展幼儿教育研究的技能。对于“专业知能”指标的评价,主要可以从下列评价参考入手:专业理论课程学业水平、专业技能课程学业水平、实习见习课程学业水平、专业技能比赛成绩以及职业资格证书获取。

三、教学质量评价的实施框架

教学质量评价的实施是一项极其复杂的系统工程,涉及评价机构、评价制度、保障措施等诸多要素与关系,因此对于教学质量评价实施体系的全面呈现与阐述是一大难题。笔者试从支持学生职业发展的角度,以学生学习的起始水平、过程表现、最终成果以及后续发展作为教学质量评价实施的纵向流程,以教学质量评价核心指标为横向要素,对中职教学质量评价实施的基本框架进行初步探索。

(一)基线水平测评

在学生进入中职学习的第一周内,由学校教学评价管理部门组织对各专业学生的学业基线水平进行测评,并建立学业评价信息平台,将每一个学生的基线水平存储进入数据库。针对不同评价指标,学生学业基线水平测评方式也有所不同,具体为:

1.基本素质的基线测评

采用不同的评价手段对学生五项基本素质进行测评,主要利用日常行为评价量表、情感态度评价量表等对学生道德素质、情感素质进行测评,获得基线数据B-A1、B-A2;以语、数、外、音、体、美等文化课程为主要考核方式,对学生的身心素质、智力素质进行测评,获得基线数据B-A3、B-A4;最后通过社会实践等课程考核获得学生实践素质的基线数据B-A5。

2.专业知能的基线测评

由专业教师组织对学生的专业理论知识与专业技能进行基线测评,通过理论笔试与技能实考等形式,获得专业知能B-B1和B-B2的基线数据。

3.职业素养的基线测评

参考国外职业素养测评专业量表,结合学校生源特点,按职业道德、职业关键力、职业情商与职业个性四项维度,编制校本《中职学生职业素养测评量表》,组织学生进行量表测评,获得职业素养B-C1、B-C4的基线数据。

(二)过程监控管理

对于学生学习过程的监控管理,是过程性评价的重要体现,教学评价管理部门应从以下几个方面实施评价:

1.课堂教学监控

这是教学质量过程评价的主体环节,做到“对教师教学的评价”与“对学生学习的评价”相结合,通过建立“评价部门—教学组—教师”三级监控机制,对基础文化课程、专业理论课程的课堂教学进行监控管理,由教师对每一位学生的学业表现进行实时监控,并将评价信息登录评价信息平台;由教学组对教师的课堂教学,开展教案检查、听课评课、教学反思等常规教学监控活动;最后由评价管理部门对各个教学组的活动进行统一监控管理。

2.实习见习监控

对于学生专业技能与职业素养两大指标的过程性评价,主要通过对实习见习活动的监控管理。以“学校—企业”为教学评价双主体,由学校实习指导教师和企业师傅联合对学生的实习见习过程进行评价,将学生在专业技能与职业素养方面的变化信息反馈至评价信息平台。此外,学生在各类专业技能竞赛中的成绩作为参考指标纳入本环节的评价内容。

3.阶段性水平测评

以学期为一个阶段,针对教学质量评价核心指标,按照基线水平测评的方法程序,进行阶段性水平测评,将测评结果按学期分别标为I阶段、II阶段、III阶段等,并将每个阶段水平与基线水平进行统计,经诊断分析,形成教学质量评价报告,反馈给教师、学生,并对存在的问题发出预警,提供改进建议。

(三)发展水平评定

对学业发展水平的评定,既是对于学校教学质量的最终评价,也是对于学生发展的关注,主要分为:

1.发展水平测评

在学生完成学校全部教学计划之后,由评价管理部门组织对学生的基本素质、专业知能与职业素养三大评价指标进行最终成就水平测评,获得学生发展水平数据(D-A1—D-C4),发展水平(D)与基线水平(B)之间的统计比较结果,成为评价学校教学质量的重要信息。

2.资格证书审核

对资格证书的审核主要是对专业知能达成水平的最终评价,通过对学生获得的职业资格书数量、比例、等级等数据进行统计,以此反映学生在就业竞争力方面的水平以及学校职业教育的质量。

3.毕业去向统计

中职学校毕业生已不再全部面向就业市场,毕业去向的多元性已经成为中职教育的一大趋势,主要包括了就业、升学深造、出国留学、自主创业等,对学生的毕业去向进行搜集统计,既是对中职教育人才培养目标多样性的评价,也为关注学生职业生涯的后续发展奠定了基础。为了进一步关注学生后续发展,可对学生的职业发展进行追踪。例如,定期与学校毕业生取得联系,调查毕业生职业生涯发展状况,建立学校毕业生数据库,实现职业教育对人发展的终身关怀。

作者:叶盛楠 单位:浙江宁波外事学校

教育测量与评价论文篇(3)

    1964年《劳卫制》改为《青少年体育锻炼标准》,所以,这一阶段应是实行“体育锻炼标准”的起始阶段,但随着“军国民体育”的抬头,1967年底军训课开始逐渐代替了体育课,1971年后军体课正式列入课程表。此时的学校体育评价以学生的军事技能为主。

    1978年实施的《全日制十年制中小学体育教学大纲(试行草案)》首次在考核项目中设置了素质项目,促进了“课课练”在体育教学中的应用,使增强学生体质的目标在体育教学中得到落实,评价领域主要集中在速度运动素质、速度耐力运动素质、爆发力运动素质、力量素质运动技能及力量素质方面,而且把学生体质是否有所增强作为评定学校体育工作成绩的标准,这一评价思想一直影响至今。

    这一阶段由于“文化大革命”十年的影响,真正开展学校体育评价工作的时间较短,也未形成完整的理论体系,评价思想及模式也仅散见于有限的规范性文件当中。总结建国到1978年时期我国学校体育评价工作可以发现,由于全盘苏化、“大跃进”和“文化大革命”的影响,和同时期国外教育评价理论和实践研究快速发展相比,我国的理论研究近乎一片空白。评价的实践工作虽然仅集中在对学生体能的测试方面,但其活动的进行为我国当时学校体育工作的开展作出了不小的贡献,实践经验的积累也为今后理论研究奠定了一定的基础。

    探索创新和快速发展时期(1979年至今)

    在党的十一届三中全会春风的吹拂下,我国迎来了思想的解放、经济的发展、政治的昌明、教育的勃兴、科学的春天,作为教育事业重要组成部分的学校体育工作也逐步走上了健康发展的轨道。伴随着教育改革的不断深入,关于学校体育评价理论的研究也步入了改革创新和快速发展时期,取得了丰硕的成果。

    1第一阶段(1979-2001年)

    这一阶段以1979年教育部等四部委联合召开的扬州会议为主要标志。伴随着改革的进程,学校体育评价理论研究工作也得到了广泛的开展,取得了一些成果,形成了一定理论积累。1975年原国家体委公布的《国家体育锻炼标准》(后经1982年和1990两次修改)、1990年原国家教委颁布《普通高等学校教育评估暂行规定》和国务院1999年颁布的《中共中央国务院关于深化教育改革全面推进素质教育的决定》为学校体育评价理论研究工作提供了指导。

    1.1主要研究成就

    体育测量与评价的研究有所发展,起步较早的是广州体育学院的陈骏良。1982年广州体育学院受教育部的委托,举办了“体育测量”的学习班和学术讨论会。广州体育学院《体育测量与评价》教学小组在陈骏良的主持下,收集、分析研究国外研究成果的基础上,提出了《体育测量与评价》较为完整的内容体系表。该教学小组还结合我国体育师资培养的现实需要,分析了我国体育院系开设《体育测量与评价》课程的意义,提出了在我国如何开展该课程的具体设想,为形成我国自己的《体育测量与评价》奠定了基础。

    产生了一些有较高学习和应用价值的专着。较早的研究成果是邢文华等1983年编着出版的《中小学生体质测定与评价》和1985年出版的《体育测量与评价》;1987年赵秋蓉等编着的《体育测量评价》出版;1987年陈骏良主编,国内第一本经国家教委审定的《体育测量学基础》教材出版,1991年其又编译了《体育测量与评价》,把国外学校先进的体育评价理论引进到了我国,对我国这方面的研究提供了参考;1995年全国体育学院教材委员会编着了《体育测量评价》,成为我国体育院系学生的正式教材,为我国培养学校体育评价理论研究和实践人才作出了巨大贡献。

    这一阶段研究领域逐渐扩大,涉及到学生、教师活动、学校体育管理等多个方面;评价方法的研究得到重视,对学生评价的具体步骤和方法已有较详细的设计,有数十位专家学者设计了各种评价指标体系和具体的评价方法;模糊数学评判法受到了广泛的关注;提出了目标评价模式,华东师范大学的张争鸣认为“要进行学校体育评价,必须探讨如何制定合理的、可行的、可测的、可靠的学校体育目标体系。”他同时提出了“必须以定性描述为基础,采用定性评价与定量评价相结合”的观点,这些观点至今仍是我国教育评价理论和实践研究的重点。

    1.2研究特点该阶段评价方法研究较多,对于学校体育在实践

    中应采取什么类型的评价形式研究较少。譬如应采取相对评价还是绝对评价,抑或是个体内差异评价;对学生、教师应采用过程性评价还是终结性评价,这方面的基础理论研究明显不足。仅有刘永东、王剑君提出“体育成绩的评定应着眼于教学开始与结束时成绩的变化上,利用进步分评价体育成绩不仅可能,而且必要”。

    他们建立了进步分评价常模,并建议采取个体内差异形式对学生进行评价。这一阶段关于学校体育评价的研究取得了很多有价值的成果,其中对学校体育评价理论的发展进行了有意的探索,对当时高校体育工作起到了极大的促进作用。但随着研究的深入,有些学者已经注意到有些观念和具体评价方法已不能适应现代教育的发展要求,譬如林永森就对当时的体育效果评价提出了“身体素质检测不确定性、赋值评价分值安排难求合理和评价体系忽视了课外活动的内容”3个方面的质疑,并提出了建立合理体育效果评价的新思路。

    2第二阶段(2002年至今)

    2002年教育部制定了《全国普通高等学校体育课程教学指导纲要》,确定体育课程评价包括对学生的学习、教师的教学和课程建设等3个方面,并分别就这3个方面的评价内容给予了原则性规定。同年又颁布了《教育部关于积极推进中小学评价与考试制度改革的通知》,对中小学评价与考试制度改革的原则做了详细的规定。

    2.1主要研究成就

    产生了一些新的学校体育评价理论,研究更加全面和深入。李建军编着的《新课程的学校体育评价》以“体育与健康课程评价”为主要研究内容,明确提出了发展性和“主体取向”的学校体育评价思想,为我国学校体育评价研究提供了新的思路。姚蕾和杨铁黎所着《中小学体育教学评价的基本理论与实践》关注了学生体育态度的评价,认为“通过对体育态度的测量,可以检验体育教学大纲的内容和教学方法对学生情感究竟有什么样的影响,为改进体育教学方法,提高教学效果提供较为客观的理论依据。”并对学生体育态度评价的具体方法进行了分析。

    四川大学体育学院的张超慧等编着的《学校体育评价》不仅对学校体育评价从理论上进行了深入的分析,而且介绍了评价实践的一些具体方法。对元评价的研究受到重视,建立了一定的元评价量化分析模型。金红珍在分析教学评价元评价的内涵和意义基础上提出了体育教学评价信度和效度的量化分析模型。杨军等人所着《学校体育评价理论与实践》一书,不仅对国内外关于学校体育评价现状进行了阐述,确立了学校体育评价的理论基础,并且对学校评价、体育教师评价和学生评价方法进行了详细的分析。

    这一阶段的研究把统计学、数学模型、心理学等其他学科知识应用到学校体育评价中来,出现了一些对国外学校体育评价的研究成果。张建华、杨铁黎、殷恒婵通过对美、日两国体育教学评价的改革和发展现状的比较研究,了解到国外体育教学评价的共同发展趋势是“重视过程性评价和个性评价、评价内容多元化、评价方法和工具多样化、强调定性与定量化评价相结合”,对我国体育教学评价改革有重要的启示作用。

    该阶段提出了发展性评价理论,有不少学者对自我评价、形成性评价、多元评价体系进行了理论研究,并构建了多种评价指标体系,如张京生等人在2002至2003运用发展性评价理论进行了体育学习行为和效果的跟踪试验,验证了发展性评价对学生体育学习与学习效果的积极影响。杨军、闫建华等人在发展性评价理论基础上把质性评价引入体育教师评价,构建了质性评价和量化评价相结合的多元主体参与的体育教师业务能力评价体系,使评价更全面,更有利于教师的专业发展和业务能力的提高。

    2.2研究特点

    高校体育评价研究更加深入,关于中小学校体育评价也受到重视。伴随着基础教育课程改革的深入和推广以及国家对中小学评价制度改革提出的要求,这一时期关于中小学体育评价的研究热情空前的高涨,产生了大量有影响的研究成果。

    研究领域更加广泛,涉及到了学生体育学习行为和态度、体育考核、课余训练及学校体育工作的各个方面,对体育教师综合素质的评价研究受到了关注。

    开始对现行评价体系进行反思和改革,随着教育评价理论的发展和“健康第一”思想的提出,过去学校体育评价理论中的一些观点和方法已不再适应时代的要求,不少学者在研究先进评价理论的基础上,分析了我国过去学校体育评价体系的不足,提出了一些好的改革意见,构建了不少新的评价体系。如陈玉清、李汉超从“以人为本”理念的角度,对高校公共体育课的教学评价进行了研究,提出了更新观念、建立创新评价体系的思路和建议。

    反思与展望

    1对我国学校体育评价研究的反思

教育测量与评价论文篇(4)

[关键词]教育统计;德育评价;品德测评法

[作者简介]易瑞洁,长江大学政法学院助理研究员,湖北荆州434104

[中图分类号]C41

[文献标识码]A

[文章编号]1672―2728(2006)11―0207-03

如何科学地评价德育工作及其质量,这是一个世界性的难题。虽然我国在德育学科的研究上取得了世界瞩目的成就,但德育评价方面的研究却十分缺少。德育作为一种塑造学生心灵、建设社会主义精神文明的系统工程,必然要求科学的德育评价作为其信息反馈的手段,而教育统计方法的应用,正是适应了这一要求,使德育评价又有了一个科学手段。

一、德育评价和品德测评

德育评价是人们依据一定的评价标准,通过科学的方法和正确的途径,多方面收集适合的事实性材料,对德育活动及其效果的价值作出判断的过程。在德育评价及其研究中,要特别重视德育质量的评价。目前所进行的德育评价,大多属于德育工作的评价,由于德育过程的复杂性和长期性,对德育工作进行评价是必要的,但德育评价中更为重要的是德育质量的评价,德育工作评价本身不能代替德育质量的评价。在德育质量的评价中,要以学生品德评价为主,这是因为德育质量主要体现在学生品德水平的提高上。德育质量评价的难点与关键点也在于对学生品德的科学评价――品德测评。

品德测评是品德测量与评价的总称。这个总称并不是“测量”与“评价”两个概念的机械相加,而是指一种建立在对德育信息“测”与“量”基础上的分析判断,它实质上就是统计分析的过程。在这个过程中,测评者通过“测”与“量”的活动,获得所要收集的品德特征信息,然后进行比较,以求得认识。这里的认识不是仅凭个体的感性经验,而是积极地借助教育统计进行分析,把最终的比较与判断建立在客观事实的收集、测量和分析上,并且把分析判断的结果,采用语言和数量的形式,进行定性或定量的转化与解释,由此来反映个体品德发展的客观情况。

二、教育统计及其意义

教育统计是和统计、学校统计既有联系又有区别的不同层次的概念,这是我们必须要弄清楚的问题。

统计,原指总括计算的意思,当它作为科学术语使用时,往往有不同的含义:一指统计资料,把说明社会政治、经济和文化等现象的数字或数据称为统计;二指统计工作,把统计资料的收集、整理、发表和分析等实践活动本身称为统计;三指统计科学,即研究总体现象的数量表现、变化规律及其运用的科学总称。学校统计是教育学与数理统计学相结合的一门交叉学科,是应用统计的分支,它把统计学的方法应用于教育实际工作和教育科学研究,通过数据的分析和处理,以便更准确地掌握教育情况,为探索规律,制定教学方案,检查教育效率,提供一种教育方法。教育统计,即学校教育统计,是针对各级各类学校中教育现象和数量情况,应用数理统计的原理和方法,进行收集、整理、分析和推断,探索教育规律,进行教育决策的教育管理方法。掌握和应用教育统计的知识和技能,对于学校管理、教育科研、教学工作、学生学习等方面都是十分必要的,意义十分重大。

1.教育统计是教育科研活动的基础。现代教育的新观念和新理论的发展往往都需要借助于统计方法,这可以从以下几点来说明:(1)教育统计可以使研究的数据由繁化简。运用分类、列表、图示、计算等统计方法,可以使我们从纷乱庞杂的现象中理出头绪,从个性中看出共性,从特殊上升到一般。(2)教育统计可以从样组统计量推断出普遍的结论。科学研究往往是从已知推出未知,具体地说,是从样组推断总体,教育统计就具有这种功能。(3)教育统计可以帮助我们作预测。比如,我们可以根据学生高中学习成绩和大学入学考试分数来预测该生一年后的学习成绩。当然这种预测不是没有误差的,然而统计方法可以告诉我们误差有多少。(4)教育统计使实验设计更为合理。现代统计作为科学方法论,它已把推断统计与实验设计紧密结合在一起了,因而我们就可以在复杂的教育现象中分析出因果关系。各种教育研究的实验设计与实施实验,均需要用到统计方法。

2.教育统计有助于科学方法的训练。教育统计有描述统计和推断统计。统计推理是一种归纳法的推论,它可以使我们从庞杂的数据中理出可取的信息,学会从客观实际出发,去粗取精、去伪存真、由此及彼、有表及里的科学方法和科学态度。作为教育研究者如能熟悉各种统计推论的方法,也就能用客观的方法来研究教育及各种教育现象。

3.教育统计可以帮助我们了解许多教育研究的成果。在现代教育研究文献中,除教育哲学和教育史外,其他如教育状况的研究、教育测验、教育心理学,都会采用各种统计方法。如果研究者不掌握统计符号、统计基本概念和统计思维方法,就无法阅读有关文献,不能吸取新鲜的成果。

三、教育统计在学生思想品德评定中的应用

目前世界各国,在人才选拔过程中,或是对学生的品德不加考虑,只看智育考试成绩;或是以老师与学校的评语作为依据。由于每个人的价值观不同、评定的重点不同、评定“尺度”和标准不同,因而每个老师或学校所作的品德评定的结果常常会缺乏客观性和可比性,不能为人才选拔提供可靠的依据。为此,笔者认为可以把教育统计方法应用到该领域里,设计出既适合于工作和毕业会考,又适合于人才选拔的FRC品德测评法。

FRC品德测评法是事实报告计算机辅助分析的考核性品德测评法。F是英文词fact(事实)的头一个字母;R是英文词report(报告)的头一个字;C是英文词computer(电脑或计算机)的头一个字母。FRC是事实报告计算机测评法的缩写。其基本思想是:借助计算机分析技术,从学生品德结构要素中确定一些基本要素,再从基本要素中选择一些表征行为或事实,然后要求学生自己就是否具备这些表征行为或事实予以报告。报告的形式既可以是个别谈话,也可以是集体问卷,每个学生所报告的表征行为或事实经过光电信息处理,储存于个人品行信息库里,然后计算机根据专家仿真测评系统对学生报告的表征行为进行分析,作出定性和定量的评定。

这种品德测评法的特点在于它能够克服长期以来学生品德测评因缺乏同一标准、同一测评系统、不客观公正的缺点,使品德评价有了比较客观的依据。

这种品德测评法的步骤程序,即学生个体独立报告表征行为与事实,可以采取个体测评方式,直接通过计算机终端输入;也可以采取集体测评方式,在规定的时间与场合,统一地对所问的各种行为事实予以实事求是的报告。报告的方式是先在问卷上作出选择,然后把所选择的结果用特定的2B铅笔标记在答卷上。

逐张输入学生的答卷卡,进行光电阅读并储存。同时,要求学生干部和老师检查每个同学问卷上的选择,检查答卷是否符合要求。

进行电脑比较判断。当检查卡与答卷卡的结果在误差允许范围内,则进行测评,否则退出,要求机外调查证实与修正。

测评后报告分数、等级与评语,并作出有关专家的诊断与指导建议。可以图示为:

FRC品德测评法的设计,可以把中小学班主任从期末操行评语的困境中解脱出来,不需要再去写一些套话、空话或者做文字变换游戏,只须补充一些学生的突出个性特征与典型事例,使提高品德测评的客观性、建构一种适合大规模选拔考核学生品德的统测统评方法成为可能。通过实验证明,这种品德测评法既便于操作,也具有较高信度,是教育统计与德育评价的有效结合。但这种品德测评法的设计,目前仅仅适用于中小学,它是否适合于大学生,还有待于进一步的研究。

教育测量与评价论文篇(5)

我国正处于高等教育大众化向普及化的转型期,受教育者资质各异,学业需求与学生学业发展不可避免地呈现出多样化的态势,教育成效和学生发展再度成为高等教育质量保障拓宽问题所关注的核心点。我国《国家中长期教育改革和发展规划纲要(2010~2020年)》中明确提出,提高人才培养质量是高等教育质量保障的刚性需求。我国高等教育改革已进入深水区,如何客观科学地评价高等院校自身的教育效力,科学地测量高校学生在大学四年的学业成果、发展表现及其增值幅度,是我国高等教育质量保障研究的热点与难点。与此同时,来自美国教育界的评价经验与做法为我国提供了理论与实践上的启蒙。

1 增值评价概念辨析

增值评价(Value-Added Assessment)的概念最早出现在美国,对它的研究始于1966年美国约翰霍普金斯大学社会学系科尔曼教授对美国教育公平的研究,之后陆续出现了一些涉及到学生学业评价问题的研究,直至2001年美国联邦教育法《不让一个孩子掉队》(No Child Left Behind)的出台,增值评价才开始成为美国教育评价的主流方式。

在英文语境下,增值评价的内涵范围多有交叉。有学者认为,“增值”观是针对学生学业成绩进步的增值进行价值判断,亦可称“成绩说”,此观点主要应用于基础教育领域。如汉塞克(Handshake)对增值内涵采取相对窄化的态度,将增值定义为后测与前测二者之间的成绩差异,即剩余值[1,2]。特克维(C.D.Tekwe)等将学生成绩进行连续年度的比较后所产生的变化定义为增值,并提倡以此来矫正学生入学知识或能力的教育效能评价[3]。泰勒(Taylor)和迈克柯兰(McClain)等提出了增值评价法(Value-added),认为学生在学习上进步或发展的增量可被看作是教学质量提升的结果,也是教学质量评估所要抓的重点[2]。萨丽托马斯(Sally Thomas)认为如果学校的教育可以为学生的学业成就增加“价值”,那么“增值”就表示学校所加诸学生身上,使其学习成绩超过一般期望成绩的额外部分[4]。另一种“增值”观,关注教育的整体效能,着眼于评价学生的整体发展程度的价值增值,亦可称“全面说”,在高等教育情境下应用较为广泛。学者阿斯汀(Alexander W.Astin)把有关增值内涵的观点在《实现卓越教育(Achieving educational excellence)》一书中有所阐述,他认为在高等教育情境下,所谓增值是指学校教育对大学生学业成就以及毕业后的工作生活所带来的积极影响,而增值评价即是对这种影响程度的测量[5],增值评价关注学生从进入大学到大学毕业之前所发生的变化,指出生源质量是大学教育质量的根本体现,真正的质量在于大学对学生认知和情感发展的影响程度,学生在大学期间学习和发展的变化越大,那么学校对学生发展的影响也就越大,因而学校的教育质量就越高[5]。

综上所述,虽然没有哪一种观点得以一统学界,但是通过梳理增值评价的各种概念界定,可以发现学者们对这一内涵有如下共同理解:价值增值的概念是建立在教育可以增加“价值”到学生身上这一假设基础之上的。从宽泛意义上来讲,“增值”是指在一段时间内所实施的教育活动给受教育者带来正面的、积极的影响,是推进受教育者自身获得进步与发展的价值增量。从狭义上来讲,增值评价考察教育教学对受教育者学业成绩影响的“净”效应,通过追踪研究设计,收集他们在一段时间内不同时间点上的学习成绩为评价依据,将进步与变化作为评价的核心,基于对受教育者自身的纵向比较并考虑其他不受学校或教师控制的因素对其成绩的影响,来考量其学业的进步幅度。值得注意的是,增值评价作为一种发展性的评价方法,是建立在符合学校实际、动态教学效能的基础上所产生的概念,它基于学生原有的发展水平,始终专注于教学品质的持续改进,因此增值观的核心指向也发生了从单纯注重学习成绩增长向学生整体性发展诉求的转变。

2 增值评价的理论依据与实施方式

2.1 增值评价理论依据的分析

在欧美等西方国家尤其是美国教育界,针对学生发展理论的研究已有近百年历史,美国高等教育质量评估方面的发展也深受学生发展理论的影响。对学生发展过程、结果及其影响因素深入研究与探讨所形成的学生发展理论是增值评价的理论基石。而增值评价的理论与高校学生学业评价的理论基础一脉相承,同样源自美国的大学生发展理论。

20世纪60年代以来,在心理学视域下兴起于美国心理学界的大学生发展理论是“人的发展理论”在高等教育情境下的运用,本质上来源于人的发展理论的思想内核,描述了大学生发展的某一维度或若干维度,以及经历的阶段或者某一维度的发展过程,其目标是对学生在四年的大学学习与生活中自主发展的过程做出客观化、科学化解释,揭示大学生如何发展成为了解自我、他人及世界的成熟个体的过程,旨在研究大学生的成长与变化。建立在学生发展理论基础上的增值评价理论,提倡充分尊重评价的利益相关者主体――学生的获益诉求,突破了传统评价主体的范式局限,将关切点转移到学生个体成长与发展的主体性建构上,是真正意义上的“以人为本”的培养质量评价。在探讨学生发展理论及其在人才培养质量评估领域的应用中,朱红根据不同的研究视角,把大学生发展理论分为两大类:个体发展理论和变化理论。变化理论从社会学的视角出发,侧重于关注外部因素的影响机制,强调大学生在高校期间的成长是受外在因素影响的因果关系,而个体发展理论多以心理学的视角出发,侧重于关注个体自身内部因素的影响机制,将学生在大学期间的发展更多视为一种自主发展的过程,旨在研究学生在大学期间会发生什么样的变化,以及这些变化产生的过程[6]。因此,这两种理论互为补充,从不同的角度阐释了学生在大学成长过程中的结果和机制。在探讨学生发展理论及其在学生事务管理领域的应用中,美国高校学生事务管理的一个核心的知识领域和理论基础就是大学生发展理论。克里斯汀仁(Krist Renn)将四种(个体与环境理论、社会心理理论、认知与价值观理论、整合型理论)普遍应用于美国学生事务研究领域的学生发展理论进行了梳理和概括[7],他指出,各种类型的理论并非彼此孤立而截然分开,有些理论难以划归于单一的理论类型,某一特定的理论有可能是跨越性的理论。依据这个观点,对于学生发展理论做进一步的研究是非常有必要的,理论的价值在于应用,但理论成果没有被应用于实践和改进,或者说应用效果的适切性不佳,那么理论的实践意义和参考价值也就无从体现了。

由此可见,增值评价的理论概念并不是静态的,而是与心理学领域的理论与实践共同成长、齐头并进的。一方面,在面对不同的主客体情境与价值导向时,研究者可以从文献中发现评价过程中所涉及的各种心理学概念,各个理论在主要观点上也存在着差异。另一方面,来源于美国的大学生发展理论这一概念虽然在我国也得到了广泛的运用,但在应用过程当中不免会出现跟中国的教育情境不相适恰的问题,目前我国教育界还缺少自主研发的理论基础。中国的大学生发展是否有规律可循,美国的大学生发展理论是否能够描述、解释、预测和指导中国的大学生发展,这还有待深入研究[8]。

2.2 增值评价实施方式的分析

从美国的相关研究来看,学生学业成果是高校增值评价的关键指标。高校学生学业的评价指标通常以学生在知识、技能、能力等方面的参与体验和收获来构建,包括认知与非认知、心理、行为等若干层面,对它们的界定将直接影响评价结果[5]。这些指标获取的途径主要有两种:第一种是具有直接、客观等特点的学生标准化测试;第二种是具有间接、主观等特点的自陈式量表/自我报告型调查问卷。从数据的质量上来看,每一种评价方法对学业成果的反映都有其优势与局限。标准化测试侧重考查学生的学习结果,其优点在于测试成绩的客观性强、尤其是能够直接反映大学生的核心认知能力及增值情况,具有较高的信效度,且数据易于收集和统计,这类数据对改进教师教学及学生学习过程具有重要意义,且有助于在不同学校之间进行学生学习成果差异比较,探索差异背后的深层影响因素[5]。但是标准化测试对大学生的情感、态度、人格等非认知层面的学业成果的测量方面尚属空白,学生主体参加测试的动机和意愿也会直接影响测试结果的效度;相对于标准化测试,自陈式量表/自我报告型调查问卷的亮点在于关注对学生学习的过程、经历、态度、感受等方面的考量,所得数据更能丰富地反映出大学生课内外学习与活动的参与情况以及自我对个体发展与收获情况,但是自我报告型调查量表的测量效度不易建立,理论构思与假设的合理性、科学性及其转换为指标的恰当程度与可操作性都不易把握。

高校学生在就读期间的学习经历和收获存在较大的异质性,评价指标的发散化和柔软化使学生发展的增值情况也很难通过单一的评价工具来获得。“多法并用”是高校学生学业评价方法的有效方式[9]。当前国际教育评估界还缺乏将标准化测试与自陈式自我问卷调查量表相结合的好办法。因此,在未来获取数据信息的过程中,研究者该如何扬长避短,如何寻求两者的相互融合而为增值评价通过一次评估即可同时获得全面的、客观的、动态化的数据信息,是高校学生学业增值评价的挑战。

3 我国高校学生学业增值评价的现实与 启示

3.1 增值评价工具的分析

目前,高等教育阶段的学生学业增值评价主要依赖于标准化测试和自陈式量表/自我报告型调查问卷。其中,由2000年美国兰德公司(Research and Development Corporation,简称RAND)和教育资助委员会共同开发的《大学学习评估》(The Collegiate Learning Assessment,简称CLA)、《大学生学术熟练程度与进步测量》(Measure of Academic Proficiency and Progress,简称MAPP)等,这些测量工具主要测量大学生的认知能力,测验数据主要用于评价大学对学生综合能力的提升(即学生能力的增值)[10],它们是较有代表性的测标准化测试;目前在学界较为流行的由全美高等教育管理系统中心(National Center for Higher Education Management System)、皮尤慈善信托基金会(Pew Charitable Trusts, PCT)与美国印第安纳大学调查研究中心共同研发的“全国性大学生参与度调查”(National Survey of Student Engagement, NSSE)是一种通过对学生投入各项有效学习的程度所展开的调查,它通过从问卷结果中提炼与学生个体学习收获相关的、动态性的、过程性的评价指标,选取相应的模型来构建评价体系[11],并采用高级统计方法(如Hierarchical Linear Model,简称HLM模型,该模型同时也是增值研究的主流工具)来深入分析各个因素及变量间的复杂关系及直接或间接的影响来实现对大学生学习过程和结果的增值评价,属于自我报告型调查问卷。通过以上途径而获得数据后,所进行的统计分析模型主要有三种:分数差值法、多元线性回归模型(Multivariable Linear Regression Model)以及多水平分析模型(Hierarchical Lineaer Model,简称HLM),它们目前是美国所采用的主流分析模型。其中,从评估频率(Frequency of Assessment)上看,增值评价拥有多个比较基准,在纵向评估(Longitudinal Assessment)的过程中可以对时间序列上所产生的发展与变化进行有效比较,这是增值评价模型成为当前美国教育评价主流原因之一[12]。

事实上,通过研究发现并得出结论,增值评价不存在世界范围统一的评价模式。受实际因素的影响,在同一国家内的不同地区尚且存在不同的评价模式,统计方法与评价模型本身的不断完善与发展的动态过程也使评价结果受模型变化的影响较大,通过不同的模型对同一套数据进行分析,所得出的结果也不尽相同[13]。综上所述,鉴于学习活动本身是一个动态的、多维度的活动,因此对探索构建评价的过程性指标就别具意义,评价工具的开发者也频繁地使用那些能够体现“价值增值”的要素来构建测量维度。这对增值评价在我国高等教育界的推广提供了技术与信念上的支持。

3.2 增值评价实施过程中的价值与准则

在教育学语境下,所谓的“价值”是由一群社群、团体或个人所坚持的完美典范,或者是相关优点的归因,或对象的有用性所构成[14],价值是开展评价活动的基石。“评价”属于一种价值判断活动,任何评价都与评价人的价值选择有关,评价方依据价值的明确来展开评价。与此同时,价值提供并导出了评价准则的基础,在测量一项评价活动的价值或质量时,评价方所基于的那些共同认可的原则,即为准则。价值与准则共同引导了评价工具的建构与评价标准的阐释方向。价值的明确活动在评价过程中是持续不断的,对完成评价任务来说,这是一个挑战。从某种意义上来说,评价过程中的价值与准则是完成评价任务的灵魂构成,它们也是一种方向性的要求,从某种程度上来说,它直接制约着学生的学业发展。因此,增值评价的价值澄清与准则说明它们跟评价的设计与实施间应该保持流体般的交互状态,两者的研究进度不能截然脱离,不能只停留在某一界面上进行单独的改良与革新。

在保存与维护并提升美国社会共同利益的过程中,存在着一种十分重要的普世价值观:针对社会所有方面,都应进行共同、全面且持续的努力来改善质量,所有行为都应致力追求卓越。由此,美国教育界的高等教育质量运动带来了一种共同的学习责任感、一种倾听服务对象心声的习惯、一种数据偏好、一种持续提升的道德、一种充分开发每一位学习者才能的决心,还有一种认同,就是工作上对同事和服务对象负责的义务[3]。同时,增值评价对学业评价的目的提出了价值澄清的要求,价值澄清的目的在于教育政策制定者通过选择和实践过程来增进赋予理智的价值选择。正是这些被突显出来的价值诉求孕育了对追求高等教育卓越的思考和探索,为我国的高等教育评价的理论研究注入了新的活力。

3.3 对我国的启示与借鉴:以教育公平促进高等 教育质量卓越

公平是社会与教育的核心价值,也是教育灵魂卓越的要素。推进教育公平作为社会公平和正义的基础和先行条件,是促进教育发展从规模扩张向质量内涵转型发展的关键。保障教育公平和提高教育质量是追求教育卓越的两个重要维度,也是当今世界各国高等教育发展的共同目标。从整体上来讲,我国的高等教育大众化在“量”的层面上是对教育公平起到了促进作用,但是在“质”的表现上就不尽理想。“质”的公平将逐步成为我国高等教育公平问题的核心要素,如何促进质的建设是评价活动的价值所在。在我国实施高校学生学业增值评价的意义在于促进教育公平、提高教育质量,保障每位受教育者都能得到充分的发展。

教育测量与评价论文篇(6)

(1.阜阳师范学院 信息工程学院;2.阜阳师范学院 商学院,安徽 阜阳 236041)

摘要:教师教学质量评价对提高教学质量具有重要的指导意义,而现有的教师教学质量评价体系指标冗杂,并非都是必不可少的.以粗糙集的代数理论为基础,利用信息熵属性约简方法对教师教学评价指标进行分析、约简.通过实验表明该方法用于教学质量评价中,克服了评价指标的冗余性,简化了教学测评体系,从而对提高教学质量具有一定的指导意义.

关键词 :粗糙集;属性约简;教学质量评价;熵

中图分类号:G642.0文献标识码:A文章编号:1673-260X(2015)05-0210-02

1 引言

教师教学质量与学生对知识的接受及其能力的培养有直接关系,建立科学的评价指标体系,对教学质量的评价方法进行优化,对于提高教学管理水平具有重要意义.教师教学质量评价是参照一定的教育目标,通过对系统的信息进行搜集和分析,运用可操作的科学手段,对教育结果和日常教育过程进行价值判断,为完善教学活动和教育决策提供可靠依据的过程[1].现有的教学质量评价体系仍有一些地方不足,比如,冗余的评价指标加大了教学质量评价的工作量[2].然而这些冗余的评价指标并非都是必不可少的,其中有些指标对评价结果的影响很小,在不影响评价结果的情况下,可以根据不同指标对评价结果的关联程度进行筛选,选出与评价结果关联度最大的指标组合,从而简化教学质量评价体系,降低信息系统所需整体空间,简化教学测评[3].

粗糙集理论于1982年提出,的新的数学理论,主要是对不完整、不确定数据的进行研究,该理论的最大特点是面对数据说话,无需提供数据之外的任何主观先验信息,因此对问题的处理较为客观[4,5].属性约简是粗糙集理论中的一个主要内容,其核心思想是:在不改变原始信息系统分类能力前提下,求出数据属性集的一个最优子集或较优子集[3].信息熵属性约简算法即是利用信息论的方法,定义熵和条件熵,利用条件熵值的大小来对条件属性进行约简.本文在粗糙集的代数理论基础上,利用信息熵属性约简的方法处理教学质量评价,对评价指标进行化简,得出了较满意的结果.

2 一种改进的条件信息熵属性约简

一个信息系统可以用四元组S=(U,A=C∪D,V,f)表示,其中U={x1,x2,…,xk}是论域;C为条件属性的集合;D为决策属性的集合;V=Va,Va为属性a的值域;f:U×C∪DV为信息函数,表示x∈D所对应的每一属性a的取值.可以认为U上任一属性集合是定义在U上的子集组成的e代数上的一个随机变量[6].

定义1 设P,Q在U上导出的划分分别为X={X1,X2,…,Xn}和Y={Y1,Y2,…,Yn},则P,Q在U上的子集组成的e代数的概率分布分别为

定义2 属性集合P的熵H(P)定义为

定义3 属性集合Q相对于属性集合P的条件熵H(Q|P)定义为

其中,P(Yj|Xi)=|Yj∩Xi|?筑|Xi|,i=1,2,…,n,j=1,2,…,m.

定义4 设R?哿C,则对于任意属性a∈R的重要性SGF(a,R,D)定义为:

SGF(a,R,D)=H(D|R-{a})-H(D|R).

SGF(a,R,D)的值越小,说明在已知R的条件下,属性a对于属性D就越不重要,可将SGF(a,R,D)作为寻找最小约简的启发信息,减少搜索空间

条件信息熵属性约简算法利用条件熵为启发知识设计决策表,是一种启发式知识约简算法,通过对条件信息熵值的比较,来确定某个属性能否被约简.

基于一种改进的条件信息熵属性约简算法[7]:

输入:一个决策表系统为S=(U,C∪D,V,f),初始化R=C.

输出:该决策表系统的一个相对约简R.

s1:计算决策表S中D的C正域POSCD,并计算D相对每个条件属性a的条件熵H(D|a);

s2:对于R中的每个属性计算SGF(a,R,D);

s3:按照SGF(a,R,D)递增的顺序对条件属性ai进行排列(对于SGF(a,R,D)相对的,按照H(D|ai)递减的顺序进行排列);

s4:按照s3中排列好的条件属性顺序依次循环比较POS与POSCD,若POSD=POSCD,则ai是可约的,R=R-{ai},循环终止,转s2.

3 教师教学质量评价指标的约简

对文献[3]中授课教师上课情况调查表进行分析,将其作为决策表,如表1.教学目的测评结果A、把教学准备测评结果B、选用教材测评结果C、讲授方法测评结果D、讲授测评结果E、教学深度测评结果F、运用启发式教学测评结果G、课堂信息量测评结果H、理论联系实际测评结果I、课堂时间安排测评结果J、使用现代教学测评结果K、教师教学测评结果L、书写表达测评结果M、普通话教学测评结果N、课堂组织测评结果O等15个教学评价指标作为条件属性,把决策属性看成授课教师课堂教学质量的总体评价P.

应用本文所采用的一种条件信息熵属性约简算法对该表进行处理,由一个含有15个评价指标的评价体系得到一个指标较少的,只有3个指标的评价体系,如表2所示.由以上结果可看出,只需要对教学目的,课堂信息量以及书写表达这三个指标进行测评就能得到同样的评价结果.教师教学质量评价的工作量可以明显减少,提高评价效率,对教师教学质量的评价具有重要意义.

4 结束语

本文利用条件信息熵属性约简方法对教师教学质量评价系统中条件属性进行约简,最终得出与决策属性关联度较大的三个指标.结果表明,使用讲授方法、教学目的以及课堂信息量与教师教学质量有显著的关系,关联度较大.因此,在教师教学质量评价中,可着重关注这三个指标,从而简化信息,减少工作量.这对以后的教师教学评价具有一定的实际参考价值.

教师教学质量评价在日益受到关注,评价方法较多样,正是由于粗糙集理论只考虑数据的客观性,因此,此方法也可以用到不同的评价体系中,搜集的数据更多,就更能体系此方法的有效性.

参考文献:

〔1〕张海燕.高校教学质量评价状况分析及优化对策[J].教育研究与实验,2009(7):17-19.

〔2〕房坤,方耀楣.基于WSR系统方法论的本科教学评估体系研究[J].高等工程教育研究,2009(5):118-121.

〔3〕李萍,程向阳,吴涛.基于粗糙模糊度属性约简的教学质量评价[J].大学数学,2014(1):28-31.

〔4〕Plawk.Z,Rough Sets-Theoretical Aspects of Reasoning about Data[M].Kluwer Academic Publishers.1991.

〔5〕王国胤.Rough集理论与知识获取[M].西安:西安交通大学出版社,2001.

教育测量与评价论文篇(7)

关键词:体育 学习评价 内涵

【中图分类号】G80【文献标识码】A【文章编号】1004-1079(2008)10-0182-02

一、教育评价的概念

评价的概念:在我国的文字中,“评价”是评定价值的简称。在英语中“evaluate” (评价)这个词,在词源上的含义也就是引出和阐发价值。

教育评价诞生于“八年研究”,“八年研究”指的是美国自1933年至1940年开展的一次课程改革研究活动。在研究中主要研究人泰勒说:“评价过程在本质上是一个确定课程与教学计划实际达到教育目标的过程”,并在此基础上提出了著名的教育评价(实质上就是课程评价)的泰勒模式。

当把“评价”一词特别地用于学校教育领域或课堂教学情境时,在一些情况下,“评价”就是“教育评价”一词的简称。下面是国内外一些学者对“评价”一词在教育教学活动情境下的若干典型的解释:

格兰朗德(N.E.Gronlund)认为,评价是为了学生达到教学目标的程度,收集、分析和解释信息的(课堂)系统过程;评价包括对学生的定量描述(测量)和定性描述(非测量)两方面。根据格兰朗德的观点,评价总是包括对测量结果需求程度的价值判断。一个完整的评价计划包括测量和非测量两种方法,用公式加以形象地表达,即:

评价=测量(定量描述)+非测量(定性描述)=价值判断

斯塔费尔比姆(L.D.Stufflebeam)等人认为,“评价是一种划定、获取和提供叙述性和判断性信息的过程。这些信息设计研究对象的目标、设计、实施和影响的价值及优缺点,以便指导如何满足教学效能核定的需要,并增加对研究对象的了解” 斯塔费尔比姆还说,“评价最重要的意图不是为了证明,而是为了改进”。

总之,可以这样来描述“教育评价”概念,所谓教育评价(educational eveluation),是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。不妨把这个定义看成是广义的教育评价。在实际工作中,可以从不同的角度出发,选用不同的定义。

二、学习评价的内涵

自桑代克提出了学力评价的观点开始,我们就已经知道,其实教育评价首先就是从学习评价开始的。自20世纪80年代以来,随着我国教育改革的深入,教育评价正式成为教育研究的一个新的领域,人们开始在不同的层面上对教育评价进行研究。作者通过研究发现,国内外对学习评价的内涵方面的研究文献非常少,为避免歧义,有必要对学习评价作一说明。

首先,学习是与获得的知识或技能的过程、情况、能力、效果有关系的,并通过对学习的过程、情况、能力、效果的评定和阐发而达到教育的效果,这才有学习评价的概念的出现。

从前面国内外学者对“评价”一词在教育教学活动情境下的若干典型的解释中,我们知道当把“评价”一词特别地用于学校教育领域或课堂教学情境时,在一定情况下,“教育评价”也就成了“学习评价”一词的简称。“评价是为了学生达到教学目标的程度,收集、分析和解释信息的系统过程”;“评价包括对学生的定量描述(测量)和定性描述(非测量)两方面”;“是按照教育目标和价值观对学生的学习成果及教育计划的效果等进行测量的过程”。其实,这些解释都是与学生的学习评价紧密相关的。我们可以看出,学习评价是指对学生的学习评价。是指依据一定的标准采取一定的手段,对学生通过教学所发生的行为,予以确定的过程。学习评价的对象是指学生的学习过程以及结果,评价者主要是任课老师。

三、学习评价与教学评价、学习测量的关系

教学评价是对教师的教学工作和学生的学习质量做出客观衡量和价值判断的过程,包括对教学过程、教学效果所进行的价值判断。从严格意义上讲,学习评价与教学评价并不是一回事,不过,由于教师和学校教学工作质量是通过学生学习的结果反映出来的,所以对学生的评价是基础和根本,世界各国学者一般也是更多地从学的方面论述教学评价的。在我国的教学论文著作中,对教学评价和学习评价并未做严格的区别,只是简单地将教学评价等同于学生学习的评价,从而造成某些认识上的混乱,实际上,教学评价更多的属于学校管理和教育督导研究的范围,学习评价则属于教学论的研究范围。

学习评价也不能等同于学习测量,测量是人们对事物进行某种数量化的测定,运用各种测量手段和各种信息只是对学生行为进行描述,而不管其价值如何,而评价则以这种描述为基础而试图确定学生行为的价值,即根据测量结果对学生的行为作出价值判断。简言之,学习测量着重于对学习状况的数量化测定,而学习评价则是在测量的基础上,着重对学习状况的“解释”与“判断”。在学习评价中,测量的手段和工具很多,但主要是测验。教师根据测验结果对学生的学习做出价值判断。判断既可以用于形容词,也可以用于短语,或一组评语表示,它主要回答某个学生在某个学科的某个单元学习中学得“怎么样”。

四、中学体育课程的学习评价的内涵

中学阶段学生的身体形态、生理机能、身体素质的增长,以及运动技能的形成,都处于最佳状态。中学生的体质、健康水平,对于提高我国全民族的体质水平,对于国家和民族的未来,都具有战略意义。

开展中学体育是促进学生身体全面发展、增强体质的最积极有效的手段,中学体育是进行智力教育不可缺少的条件和促进智育的积极因素,通过体育教学,可以使学生学习和掌握体育卫生基本知识、科学锻炼身体的技能和方法,也是对学生进行智力教育、加强体育文化教养的一部分内容。

鉴于学习评价的内涵,我们可以引申和总结出体育学习评价的含义,体育学习评价首先是对学生的评价,根据新课程的要求,除了是为达到体育目的,促进学生发展的手段之外,体育学习评价还要依照划分的五个学习领域、六个水平依据一定的标准,对学生学习成果、对学习过程 、对学生参与活动的意识、情感进行评价 。体育学习评价是体育教学过程中重要的一环,通过体育学习评价能使我们对学生完成教学任务的情况加以断定,进而为教学提供反馈信息和改进依据;同时,还可以通过学习评价这一教学环节激励学生、教育学生。

为此,笔者通过对教育、体育教学领域方面的专家34人进行体育学习评价的涵义问卷调查,专家问卷调查按社会学调查统计通用要求进行,并对问卷进行了效度和信度检验。根据本研究的内容及目的,遵循体育科研方法关于问卷设计的基本要求,设计了专家问卷调查表。问卷初稿征求了专家的意见并反复修改后,抽取10个专家,对问卷作了效度评价(见表1)。从专家调查结果看,调查问卷所列各题能反映所要调查内容,具有有效性。为了检验问卷的信度,对问卷进行了重测,两次的相关系数为0.9132(P

从调查结果来看,认为学习评价的涵义中是“对学生的评价”的有28人,占调查人数的 82%,认为是“为达到体育目的,促进学生发展的手段”的有32人,占94%,认为是“通过体育教学实践, 对学习过程的评价”的有31人,占91%,认为是“对学生参与活动的意识、情感的评价”的有 33人,占97%。

因此,我们可以这样界定体育学习评价:体育学习评价是指根据学生从事体育学习的具体情况,对其学习进展与行为变化的评价,它既包括对学生学习进程的诊断判定,又包括对学习结果的评定,还包括对学生在体育学习过程中知识与技能、过程与方法以及态度、情感、价值观等方面发展状况的评价。

参考文献

[1] 叶澜主编,陈玉琨,沈玉顺.课程改革与课程评价[M].教育科学出版社.2002.

友情链接