![](https://www.265xx.com/res/images/mobile.png)
第七章教育测验与评价
教育测量包括了从身体身体素质到兴趣态度等多个方面,如果说测量回答了有多少的问题只考察量的大,评价包含定性描述或价值判断更多的时候是两者兼而有之,升学考试就体现了测验的选拔功能如高考评定功能。
第七章教育测验与评价
第一节教育测验
一、教育测验的概念
(一)概念界说
测量是给事物的某种属性给定数值的过程,回答了“有多少”的问题。教育测量包括了从身体身体素质到兴趣态度等多个方面。
测验是对于知识水平、情意状态、运动技能等的数量化测定,有广义和狭义之分。狭义的测验仅指一份测验卷子,而广义的测验指编制试题、施测、评分到报告成绩的全过程。在教育领域,测验只是测量的一种形式,主要用来测量学生的学业成绩和心理特点。如果说测量回答了“有多少”的问题,只考察量的大小,测验则回答了“某个人做的怎么样”的问题,包含了对测验结果的解释和评判。
规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程,如期中、期末考试。它与测验的区别有两种看法。第一种是从教育测量学中引出,认为测验更为规范,从试题编制、实施测验测验到评分过程都有严格的程序,而考试则是教师可自行安排,相对灵活,技术要求不高的测验形式。另一种观点与第一种正好相反,认为测验比较随意,而考试则较为正式。本书主要采用第一种观点。
评价是对某种教育活动的价值判断。评价包含定性描述或价值判断,更多的时候是两者兼而有之。
(二)测验的功能
测验具有以下功能:(1)激励功能;(2)诊断功能。诊断性测验主要考察两个方面,一个是看基础打得好不好,可否满足学习某种新知识的需要,另一个是看理解和掌握上有什么错误及其原因所在,它为教学提供了丰富的反馈信息,使教师能及时调整教学;(3)区分和选拔功能。升学考试就体现了测验的选拔功能,如高考;(4)评定功能。
二、测验的类型
从测验目的上考虑,可以分成安置性测验、形成性测验、诊断性测验和总结性测验。从测验内容上考虑,可以分成成就测验和学能测验。从规范程度上区分,可以分成标准化测验和教师自编测验。从结果解释所参照的标准区分,又可以分成常模参照性测验和标准参照性测验。
(一)安置性测验、形成性测验、诊断性测验和总结性测验
安置性测验的根本目的是分班、分组。安置性测验涉及的范围比较窄,难度也比较低。
形成性测验针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学。诊断性测验能够反映学习中常见的错误,诊断学习困难,特别是找到困难的成因。诊断性测验的目的是发现问题,评分不作为正式成绩。
总结性测验用于对学生学习情况的阶段性总结分析。在一个段落或一门课结束后,教师会编制一套试题,
全面考察学生的掌握情况。现行小学学科测验多采用闭卷形式,有时候也要求学生完成实践性课题。
(二)标准化测验和教师自编测验
标准化测验在试题编制、施测和评分过程中有着严格的规范。标准化测验是由测验专家和教师共同编制的,试题质量较有保障。最典型的标准化测验是智力测验,如“比奈智力量表”。
教师自编测验是教师自己编制的测验,是在教学过程中针对教学实际引用现代测验原理编制的。教师自编测验针对性、灵活性强,能反映实际教学中遇到的特殊问题。
(三)成就测验和学能测验
成就测验是对学生学业成绩的检查,常结合具体学科而设。学校平时的课堂测验,期中、期末考试等,都是成就测验。
学能测验,又称学能倾向测验,它考察学生在课程学习中所获得的能力,与学业成就有较大关系。学能测验不局限于某门课程,关心各门课程都需要具有一般能力,主要包括文字推理测验和数字推理能力测验。学能测验一般在小学毕业前进行,能在一定程度上预测学生的发展潜力。
学能测验与成就测验的区别在于,成就测验针对具体的教学内容而定,着重考察知识的掌握情况;而学能测验的测验内容比较宽泛,侧重于能力考察。
(四)常模参照性测验和标准参照性测验
常模参照性测验是按照在特定群体中的相对位置决定成绩的好坏。选拔性考试一般是典型的常模参照性测验,如高考。常模参照性测验要在所定教学内容中,选出一些能区分出学生水平的题目,它不一定要面面俱到,但应该能拉开分数距离。题目难度以中等为宜,特别难和特别简单的题目要少一些。
标准参照性测验是考察是否达到了预先规定的标准,类似于各种执照考试,如驾驶执照考试。这种测验只关注考生是否达到了应该达到了应该达到的水平,而不去管别的考生怎么样。确定“合格”或“掌握”的标准是标准参照性测验能否取得成功的关键。标准参照测验往往是针对某几个特殊的知识点而设计,题目覆盖面广,并尽可能把所学的重要知识都反映出来。标准参照性测验不去刻意拉开学生间的距离,题目该难就难,该易就易,完全随知识点的要求而定。
常模参照性测验和标准参照性测验的区别是:前者着重同学间的比较,后者关心有没有达到预定的学习目标。常模参照性测验适用于选拔性考试和总结性评定;而标准参照性测验适用于诊断和发现学生的不足,从而为改进教学提供反馈信息。
三、良好测验的标准
好的测验都应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验质量。
1.实用性
实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。(便于组织。(2)测验便于
实施。(3)容易评分。(4)结果要容易解释。
2.可信度
可信度又称信度,指测验结果的前后一致程度,表示了分数的稳定性和可靠性。具体要求是,先后两次用同样的试卷测查同一批学生,则两次测验的分数应该比较相近;对同样的答卷组织两次评分,评分结果相近。如果上述评分结果相差悬殊,就表示可信度很低。评分的客观性常用评分者信度来说明。
3.有效性
有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法主要有两种:(1)内容效度,反映了题目对所考察内容的代表性问题。(2)效标关联效度,反映了测验分数和所选择的效标分数之间的一致程度。和信度相比,测验的效度更为重要。因为效度高的测验信度一定高。
4.难度
难度即测验的程度,提供了试题平均通过率的信息。一份试卷的难度取决于每一道题的难度。难度用全体被试在某题的得分率(P)表示。如果全部通过,难度为1;如果谁都没有通过,难度为0。难度值在0到1之间,难度值越大,表示题目越容易。高分段人数少,低分段的人数多,表示难度较高。高分段的人数多,低分段的人数少,表示难度较低。难度中等时,最容易拉开考生间的档次。不同的测验对难度有不同的要求,如选拔性考试难度以中等为宜,否则很难筛眩一般来说,某一道试题答对的学生少于20%时便是过深,答对的多于80%时则是偏浅。
5.区分度
区分度是测验能否拉开分数距离的指标。试题的区分度也称为鉴别力,表示某道题目能够将不同程度的学生鉴别开来的能力。试题难度直接影响区分度,特别难的题目大家都不会做,特别容易的题目大家都会做,这两种题目区分度都很低。反之,中等难度的试题的区分度比较高,难度为0.5的题目,区分度最大。
四、测验的编制和实施
(一)确定试题内容
在选择试题内容时,应设计测验蓝图。测验蓝图包括确定测验目的、测验内容以及编制双向细目表等内容。
(1)确定知识点。(2)确定认知水平。(3)设计双向细目表。双向细目表是由教学内容和教学目标构成的的。
(二)选择试题类型
课堂测验的题型有客观题和论文题两种。客观题包括填空、判断正误和多项选择等题型。论文题包括简答题和论述题。因为客观题和论文题各具优缺点,所以搭配使用效果最佳。
(三)评分
计分方法可分为等级分和百分制两类。等级分在中国隋唐一代就广为使用,百分制则是20世纪初教育测量
学的发展产物。等级制的计分方法除五分制和A、B、C、D、E外,还有许多变形。使用等级分的好处是避免了在同一分数等级上同学间的攀比,会减轻过分的分数竞争。但缺点在于,等级分比较粗略,不容易反映个体间细微的差别,评分尺度也较难把握。在评分时,教师要注意到自己对学生的看法可能会影响到评分过程。和百分制相比,等级制能避免“分分计较”的学习心理,减轻学生的考试负担。
(四)测验分数的解释
分数只有经过解释具有实际意义。解释分数时,既可以和其他同学的学习表现相比较,也可以和考核标准相对照。分数的意义是在比较中获得的。如同样考85分的两个同学,其分数值虽然相同,但反映出的水平和存在的问题并不完全相同。
第二节中小学教育评价
一、中小学教育评价概述
最早的有组织的教育评价可以回溯到中国的科举考试。西方直到19世纪末期才开始实行正规的教育评价活动,早期评价研究主要集中在美国。赖斯的拼写测验是经典的评价研究,这项研究是在1895年到1905年的十年间在美国全面开展的。20世纪初,教育评价和教育测验发展很快,此期最有影响力的桑代克被称为现代教育测验之父。到了20世纪30年代,这一时期研究成为教育评价的里程碑。20世纪50年代,布鲁姆建立了教育目标分类学。直到现在,布鲁姆的教育目标分类学仍然是测验的重要指标体系。如果说测量给定了量的大小,评价则体现了价值判断的过程。评价是一种较主观的活动。
广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称为学生评定。广义的评价较为笼统,狭义的评价关注教育效果而不看过程。
二、中小学教育评价的类型
从评价的严格程度上考虑,可以分成正式评价和非正式评价。从解释评价结果的标准上考虑,可以分成相对评价和绝对评价。从评价的功能上区分,可以分成形成性评价和总结性评价。
(一)相对评价和绝对评价
对应于常模参照性测验和标准参照性测验,评价可分为相对评价和绝对评价。相对评价是在群体中进行对比,这时衡量标准是相对的,如“矮子里拔高个”、“水涨船高”。绝对评价要和预定的标准相比较,只要达到了标准,就称为合格,如某种资格认证考试。
(二)形成性评价和总结评价
对应于形成性测验和总结性测验,评价可分为形成性评价和总结性评价。形成性评价是指在活动过程中,以改进工作为目的而开展的评价。通过揭示问题和反馈信息,这种评价对改进工作质量很有帮助。总结性评价是对活动结果的评价,它的目的在于评判活动效果。形成性评价和总结性评价在评价技术上并没有差别,只是实施过程不同。前者贯穿于活动的全过程,以改进工作为目标;后者要等到活动结束时才进行,
目的是为了鉴定分等。
三、中小学教育评价的内容
在宏观范围,教育评价涉及教育目标、教育结构、教育管理体制等方面。在中观层面,包括教育队伍、办学条件、学校各项工作。微观层面则关注学生的学习和发展。在小学教育活动中,学生发展评定、教师授课质量评价、课程和教材评价是最主要的评价活动。此外,诊断学校中存在的特殊问题,评价教改实验,评估学校的总体表现也较为常见。
(一)学生发展评定
学生发展是衡量学校办学水平的关键指标。评定学生要考虑许多方面。最基本的有学业成就、行为表现和身体状况三方面,即德育、智育和体育。学业成就不仅包括学生在知识领域的学习成绩,还包括技能和情意领域的学习表现。行为表现评价也就是操行评定,用以考察学生在道德品质和行为处事上的优点与不足。操作评定应考察学生在伦理道德、品德修养和性格特点三方面的特征和表现。身体状况评价包括体质、体力、精力、卫生习惯和良好的生活方式等方面。
(二)教师授课质量评价
进行授课评价时,首先要确定评价的标准,这个标准要明确、具体、相对独立,要能够全面衡量教学的各个方面。实施授课质量评价标准一般有以下方面:(1)教学目标完成情况,(2)学生的课堂参与,(3)内容安排,(4)教学方法,(5)语言表达,(6)教学原则。具体到每一个方面还应当具体化。教师授课质量评价包括专家、同行、学生和自我评价。现代教育评价强调教师要增强自我评价意识,加强评价的形成性功能。在中小学教学实际中,多采用听课、评课的深入交流形式评价授课质量。不是局限于固定的评价指标,要能够结合具体的情况分析教学的特色和问题。对中小学教师来说,评课是很重要的一种能力,因为评课是教学常规的一部分。
(三)课程和教材评价
四、中小学教育评价的基本步骤
评价的关键是建立评价目标,并在此基础上通过收集和整理资料,判断目标的达成情况。要想评价小学生的作文能力,就要分析小学作文教学的目标,并在此基础上建立评价标准。然后选择一些学生,考察他们的作文水平。最后要比较学生实际作文水平和教学目标的差距,分析作文教学中到底存在哪些问题。
(一)建立评价目标
现代教育评价的总目标可概括成以下类别:(1)直接与学业成就有关的评价目标,包括知识和技能目标;情意目标。(2)间接与学业成就有关的评价目标。包括学生的智能、性向等;学生的环境;身体的评价目标。
(二)选择评价样本
收集评价信息的方法主要有观察、问卷调查和访谈、检查作业、考试、家访和轶事记录法等。
(四)报告评价结果
要具备以下内容:评价目标、时间、人员、方法、结果和建议。
五、当今评价的问题与发展
(一)现存问题
测验和评价的应用以激励学生和改进教学为目标,但实际教学中,某些教师往往用测验一个尺度,从学业成绩一个方面衡量学生的发展水平,这样不仅会妨碍学生的全面发展,也会对教学改革形成阻力。有以下问题:(1)重知识轻能力。(2)片面追求分数。(3)影响学生心理健康。(4)制约教学改革
(二)发展和改革对策
现代教育评价具有以下特点:(1)注重评价的形成性功能,(2)注重定性和定量相结合的评价方法,(3)倡导自我评价,(4)尊重评价对象的感受。
1.从侧重一元评价到多元评价
以测验成绩为主要尺度,这样的评价模式就是一元评价。从多视角,采用多种方法评价学生就是多元评价。在多元评价的思想下,教育要关注学生整体能力的提高。教师不仅要在观念上树立多元评价的思想,实践上还要费一些心思。(1)重视高层次认知能力的考察。(2)重视对学习过程的检测。(3)注重对各种活动表现的检测。(4)用多种方法收集评价信息。
2.从侧重总结性评价到形成性评价
从选择适合教育的少年儿童创造适合少年儿童的教育,是评价观察上的一大变革。总结性评价重在发挥鉴定和筛选功能,评价主要是为了衡量学生的好坏。相反,形成性评价所关心的是能不能指向提高—学校的发展,学生的进步。在当前的小学教育实践中,形成性评价已经是比较主流的评价方法。
3.从侧重区分性功能到发挥激励性功能
第十二章教育测验与评价
本章重点
1.什么是考试?
2.什么是标准化测验?
3.良好测验的标准有哪些?
4.什么是教育评价?
5.什么是总结性评价?
6.如何对教师授课质量进行评价?
7.当今中小学教育评价存在的问题及改革发展的策略是什么?第一节中小学教育测验
一、教育测验的概念〔p363-364〕
1、考试的含义〔P.363〕(名解2006.10)*
教师在教学过程中编制试题、评定学生学业成绩的过程
2、测验的功能:激励、诊断、区分选拔、评定。(多选)
激励功能可采用哪些方法达成?
(1)将课程分成小单元,即时激励
(2)扩展评价范围,各显长项
(3)记录学生学业之外的突出表现,增加学生成就感
(4)注重学生发展过程中的纵向评价
二、测验的类型〔p364-367〕
1、按目的分:(单、多选)
(1)安置性测验:分班分组。如摸底测验。
(2)形成性测验:调控教学。如单元测验。----“反应学生在群体中的地位”
(3)诊断性测验:发现问题。
(4)总结性测验:阶段总结。如期末测验。
2、按规范程度分:
(1)标准化测验:如智力测验。(名解2016.10)*
(2)教师自编测验。
3、按内容分:(单、多选)
1
(1)成就测验:学生具体学科的学业成绩检查。
(2)学能测验:学习中形成的一般能力的检查。如公务员考试。
4、按解释的参照标准分:(单、多选)
(1)常模参照测验:与特定群体的平均水平比较得出相对位置。如高考。
(2)标准参照测验:与预先规定的标准比较是否达到应达到的水平。如高中毕业
会考。
三、良好测验的标准〔p368-370〕(简答2004.4,多选)*
1、实用性:便于组织、实施,节时省力。
2、可信度:测验结果的前后一致程度。(单选)
3、效度:测验能测到预先想测的目标的程度(指标中更为重要)。(单选)
4、难度:试题平均通过的程度。
5、区分度:能否拉开分数的距离。(单选)
第二节中小学教育评价
一、中小学教育评价概述
1、评价的历史:〔p375-376〕(单选)
(1)中国的科举考试――最早的有组织的教育评价。
(2)桑代克――现代教育测验之父(与泰勒—“现代课程理论之父”区别)
(3)布卢姆――建立了教育目标分类学。
2、含义:〔p376〕(名解2005.4,2006.4)*
教育评价就是利用所有可行的评价技术来评量教育所期望的一切效
果,又可分为广义、狭义两种。广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称为学生评定。
二、中小学教育评价的类型〔p377〕
1、按解释评价结果的标准分:(单、多选)
(1)相对评价:利用常模参照测验结果在群体中进行对比。如矮子里挑高子。
(2)绝对评价:利用标准参照测验结果参照预定标准进行对比。如教师资格认定
考试。
2、按评价的功能分:(单、多选)
2
(1)形成性评价:过程中进行,目的是调整后继的活动使得活动尽量不偏离预定
目标。
(2)总结性评价:事后进行,目的是评价一个阶段活动的效果。(名解,2004.1)
*
三、中小学教育评价的内容〔p378-381〕(多选)
1、学生发展评价:是衡量学校办学水平的关键指标。(单、多选)
包括:学业成就、行为表现、身体状况3方面。
2、教师授课质量评价。(简答2004.10)*
3、课程和教材评价。
四、中小学教育评价的基本步骤〔p382-385〕(多选)
1、建立评价目标:评价的关键。(单选)
2、选择评价样本:样本的代表性强不强取决于抽样方法。
3、收集评价信息。
4、报告评价结果。
五、当今中小学教育评价的存在的问题与改革的策略〔p382-385〕(论述,2003.10)
*
1、现存问题:单纯从学生学业成绩这一个方面去衡量学生的发展水平,这不仅会
妨碍学生的全面发展,也会对教学改革形成阻力。
具体表现在:(多选)
(1)重知识轻能力,助长死记硬背,加重学习负担。
(2)片面追求分数,不利于激发学生内在的求知动机。
(3)影响学生心理健康。
(4)制约教学改革。
2、发展和改革策略:(简答2005.10、2016.4)*
遵循现代教育评价的基本特点,注重评价的形成性功能,注重定性和定量相结合,倡导自我评价,尊重被评价者的感受。
(1)从侧重一元评价到多元评价,从多个视角、用多种方法评价学生。(具体4点
见教材)
(2)从侧重总结性评价到形成性评价,重视对学习过程的评价,使评价指向学校
的发展和学生的提高。(具体4点见教材)
(3)从侧重区分性功能到发挥激励性功能,坚持以找优点为评价的出发点,坚持
以个体为主的评价标准,突出鼓励性评价,让学生体验成功。(具体4点见教材)(多选)
本章真题练习№1
单选(2016.4)教师在教学过程中编制试题、评定学生学业成绩的过程,是指(C)
A.测量B.测验C.考试D.评价
单选(2002.10,2003.4)为了分班、分组的目的所进行的测验是(D)
A.形成性测验B.诊断性测验C.总结性测验D.安置性测验
单选(2004.1、2004.4)以调控教学为根本目的的测验是(B)。
A.安置性测验B.形成性测验C.诊断性测验D.总结性测验单选(2006.4)以发现问题、找出学习困难原因为目的的测验是(C)
A.安置性测验B.形成性测验C.诊断性测验D.总结性测验单选(2003.4、2016.4)反映了学生在群体中的地位的测验是(C)。
A.学能测验B.成就测验C.常模参照测验D.标准参照测验本章真题练习№2
单选(2004.1)只关注考生是否达到了应该达到的水平的测验是(D)。
A.学能测验B.成就测验C.常模参照测验D.标准参照测验多选(2003.4)良好测验的标准是(ABCDE)。
A.实用性B.可信度C.有效性D.难度E.区分度
单选(2016.4)良好测验标准中显示测验结果的前后一致程度,表示分数稳定性与可靠性的指标是(D)
A.效度B.难度C.区分度D.信度
单选(2016.10)在教学测验中先后两次用同样的试卷测查同一批学生,其结果前后一致,表示分数的稳定和可靠,这即是良好测验的(B)
A.难度B.可信度C.效度D.区分度
本章真题练习№3
单选(2016.4)教育测验能测到预先想测的知识和能力的程度,这即是测验的(B)
A.信度B.效度C.难度D.区分度
单选(2005.10)能鉴别学业水平高低、能力强弱的测验表明其(D)很高。
A.难度B.信度C.效度D.区分度
单选(2002.4)“矮子里找高个”、“水涨船高”是一种(A)
A.相对评价B.绝对评价C.定性评价D.定量评价单选(2002.4)从评价的功能上区分,中小学教育评价的类型可分为(C)
A.正式评价和非正式评价B.相对评价和绝对评价
C.形成性评价和总结性评价D.正确评价和错误评价
本章真题练习№4
单选(2003.4)在教学过程中,以改进工作为目的而开展的评价称之为(B)。
A.总结性评价B.形成性评价C.绝对评价D.相对评价
多选(2005.4)中小学教育评价的内容包括以下哪几方面?(ADE)
A.学生发展评定B.管理水平评价C.学生活动效果评价
D.教师授课质量评价E.课程和教材评价
多选(2005.10)当今教育评价存在的主要问题有(ABCD)。
A.重知识轻能力B.片面追求分数与升学
C.影响学生心理健康,唯成绩是论D.制约教学改革,标准固定划一E.以上问题都不是问题
多选(2004.10)教学实践中评价的激励功能可采用哪些方法达成?(ABDE)
A.将课程分成小单元,即时激励B.扩展评价范围,各显长项
C.重视对学习过程的检测D.记录学生学业之外的突出表现,增加学生成就感
E.注重学生发展过程中的纵向评价
第十二章教育测验与评价
一、单项选择题((有时每题2分,共40分;大部分年份每小题1分,共20分)
1.“矮子里找高个”、“水涨船高”是一种(A)。(02.4)
A.相对评价B.绝对评价C.定性评价D.定量评价
2.从评价的功能上区分,中小学教育评价的类型可分为(C)。(02.4)
A.正式评价和非正式评价B.相对评价和绝对评价
C.形成性评价和总结性评价D.正确评价和错误评价
3.为了分班、分组的目的所进行的测验是(D)。(02.10)
A.形成性测验B.诊断性测验C.总结性测验D.安置性测验
4.以分班、分组为测验的根本目的是(A)。(03.4)(08.10)
A.安置性测验B.形成性测验C.诊断性测验D.总结性测验
5.反映了学生在群体中的地位的测验是(C)。(03.4)
A.学能测验B.成就测验C.常模参照测验D.标准参照测验
6.在教学过程中,以改进工作为目的而开展的评价称之为(B)。(03.4)
A.总结性评价B.形成性评价C.绝对评价D.相对评价
7.以调控教学为根本目的的测验是(B)。(04.1)
A.安置性测验B.形成性测验C.诊断性测验D.总结性测验
8.针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学,这种测验是(B)。(04.4)
A.安置性测验B.形成性测验C.诊断性测验D.总结性测验
9.只关注考生是否达到了应该达到的水平的测验是(D)。(04.1)
A.学能测验B.成就测验C.常模参照测验D.标准参照测验
10.能鉴别学业水平高低、能力强弱的测验表明其(D)很高。(05.10)
A.难度B.信度C.效度D.区分度
19.以发现问题、找出学习困难的原因为目的的测验是(C)。(06.4)
A.安置性测验B.形成性测验C.诊断性测验
11.20世纪50年代,布鲁姆建立了(C)。(06.10)
A.教学目标分类学
C.教育目标分类学B.教育评价分类学D.教育测验分类学D.总结性测验
12.教师在教学过程中编制试题、评定学生学业成绩的过程,是指(C)(07.4)
A.测量B.测验C.考试D.评价
13.良好测验标准中显示测验结果的前后一致程度,表示分数稳定性与可靠性的指标是(D)。(07.4)
A.效度B.难度C.区分度D.信度
14.(B)是对知识水平,情意状态,运动技能的数量化测定。
A.测量B.测验C.考试D.评价E.总结
15.通过测验,一是考察学生基础打得好不好,可否满足学习新知识的需要;二是考察学生在理解和掌握上有什么错误及原因所在,这是测验的(B)功能。
A.激励功能B.诊断功能C.区分和选拔功能D.评定功能E.淘汰功能
16.美国学者B.S.(A)提出的认知目标分类系统把认知领域的教育目标分为识记、理解、应用、分析、综合、评价六个层次。
A.布鲁姆B.赖斯C.杜威D.泰勒E.布什
17.从评价功能上区分,教育评价可分为(C)和总结性评价
A.正式评价B.非正式评价C.形成性评价D.相对评价E.诊断性评价
18.对应于常模参照测验和标准参照测验,评价可分为相对评价和(C)评价。
A.形成性评价B.总结性评价C.绝对评价D.发展性评价E.正式评价
19.在教学测验中先后两次用同样的试卷测查同一批学生,其结果前后一致,表示分数的稳定和可靠,这即是良好测验的(B)(07.10)
A.难度B.可信度C.效度D.区分度
20.反映了学生在群体中的地位的测验是(C)(08.4)
A.学能测验B.成就测验C.常模参照测验D.标准参照测验
21.教育测验能测到预先想测的知识和能力的程度,这即是测验的(B)(08.4)
A.信度B.效度C.难度D.区分度
22.布鲁姆的_____仍然是现在测验的重要指标体系。(B)(09.4)
A.教学目标分类学B.教育目标分类学
分类学C.教育评价分类学D.教育测验
23.驾驶执照考试、体育达标测验都属于(D)(09.10)
A.诊断性测验B.安置性测验C.常模参照性测验
D.标准参照性测验
二、多项选择题(每题1分或2分,共10分;如单项选择每题2分则无多项选择)
1.良好测验的标准是(ABCDE)。(03.4)
A.实用性B.可信度C.有效性D.难度E.区分度
2.教学实践中评价的激励功能可采用哪些方法达成?(ABDE)(04.10)
A.将课程分成小单元,即时激励B.扩展评价范围,各显长项
C.重视对学习过程的检测D.记录学生学业之外的突出表现,增加学生成就感E.注重学生发展过程中的纵向评价
3.中小学教育评价的内容包括以下哪几方面?(ADE)(05.4)
A.学生发展评定B.管理水平评价C.学生活动效果评价
D.教师授课质量评价E.课程和教材评价
4.当今教育评价存在的主要问题有(ABCD)。(05.10)
A.重知识轻能力B.片面追求分数与升学C.影响学生心理健康,唯成绩是论
D.制约教学改革,标准固定划一E.以上问题都不是问题
三、名词解释(每小题4分,共20分)
1.总结性评价(04.1)P377
总结性评价是对活动结果的评价,它的目的在于评判活动效果。这种评价具有事后检验的性质,一般是上级教育管理部门开展的评价活动,其评价结果会影响行政决策。
2.教育评价(05.4)(06.4)P376
广义的教育评价包括对于教育活动一切方面的评价,狭义的教育评价主要是对学生发展的评价,又称学生评定。
3.考试(06.10)P363
规范的考试是教师在教学过程中编制试题、评定学生学业成绩的过程,如期中、期末考试。
4.标准化测验(07.10)P365
标准化测验从试卷上看,并没有特别之处,但在试题编制、施测和评分过程中有着严格的规范,标准化测验是由测验专家和教师共同编制的,试题质量较有保障。
5.安置性测验P364
安置性测验的根本目的是分班、分组。在讲授新内容之前,教师常常要进行摸底测验,看看学生是否掌握了学习新内容所应具备的基础知识和基本技能。
6.形成性测验P365
形成性测验针对某一教学单元而设计,在教学过程中进行,其目的不在于评定学生,而是为了调控教学。
7.诊断性测验P365
诊断性测验能够反映学习中常见的错误,诊断学习困难,特别是找到困难的成因。
8.相对评价(绝对评价)P377
相对评价是在群体中进行对比,这是衡量标准是相对的,如某个老师教的好不好是通过和其他老师相比较而获得。
绝对评价要与预定的标准相比较,只要达到了标准,就成为合格。
9.形成性评价(09.10)P377
形成性评价是指在活动过程中,以改进工作为目的而开展的评价。通过揭示问题和反馈信息,这种评价对改进工作质量很有帮助。
10.评价P376
评价是在特定信息的基础上,对事物某种属性的价值判断。
四、简答(2004.4开始改为每小题5分,共25分,以前为每题6分,共30分)
1.良好测验的标准。(04.4)(08.10)P368
好的测量应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验
质量。
(1)实用性。实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。
(2)可信度。可信度又称信度,是测验结果的前后一致程度,表示了分数的稳定性和可靠性。
(3)有效性。有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法有内容效度和效标关联效度两种。
(4)难度。难度即测验的难易程度,提供了试题平均通过率的信息。
(5)区分度。区分度是测验能否拉开分数距离的指标。试题的难度直接影响区分度,中等难度的试题区分度比较高,难度为0.5的题目,区分度不大。
2.如何对教师授课质量进行评价?(04.10)P379
授课质量评价能够让教师清楚知道自己的教学特点,了解长处与不足,也提供了新老教师相互学习的机会,对年轻教师的成长极为有益。授课质量评价可以从以下方面去衡量:(1)对新事物的感受,(2)教育分寸,(3)本学科的知识,(4)发展学生的思维,(5)培养学生的一般学习技能,(6)培养学生对学科的兴趣,(7)以个体方式对待学生,(8)学科课外活动的组织。
3.中小学教育评价的改革策略。(05.10)(08.4)P387
(1)从侧重一元评价到多元评价
(2)从侧重总结性评价到形成性评价
(3)从侧重区分性功能到发挥激励性功能
4.简述如何进行测验的编制。P371
(1)确定试题内容。设计测验蓝图,包括确定测验目的、测验内容以及编制双向细目表等内容。
(2)选择试题类型。课堂测验的题型有客观题和论问题两种,两者各具有优缺点,所以搭配使用效果更佳。想在短时间内考察较多的知识点,最好采用客观题。想深入考察学生的能力,论问题的答案提供了更丰富的信息。
(3)评分。计分方法可分为等级分和百分制两种。
(4)测验分数的解释。解释分数时,既可以和其他同学的学习表现相比较,也可以和考核标准相对照。
5.编制测验的要求是什么。P368
好的测量应当符合一定的要求,通常用实用性、信度、效度、难度和区分度等指标衡量测验质量。
(1)实用性。实用性反映了试题的基本质量,其基本要求是便于组织,便于实施,节时省力。
(2)可信度。可信度又称信度,是测验结果的前后一致程度,表示了分数的稳定性和可靠性。
(3)有效性。有效性在测量学上也称为测验的效度,指一个测验能测到预先想测的知识和能力的程度。估计测验效度的方法有内容效度和效标关联效度两种。
(4)难度。难度即测验的难易程度,提供了试题平均通过率的信息。
(5)区分度。区分度是测验能否拉开分数距离的指标。试题的难度直接影响区分度,中等难度的试题区分度比较高,难度为0.5的题目,区分度不大。
6.中小学教育评价的基本步骤。P382
(1)建立评价目标
(2)选择评价样本
(3)收集评价信息
(4)报告评价结果
五、论述(共25分;04.4以前每小题10分,共20分)
1.请结合实际工作谈谈现今中小学教育评价存在的问题及改革策略。(03.10)
现今中小学教育评价存在的问题P385
(1)重知识轻能力
(2)片面追求分数
(3)影响学生心理健康
(4)制约教学改革
中小学教育评价的改革策略。P387
(1)从侧重一元评价到多元评价
(2)从侧重总结性评价到形成性评价
(3)从侧重区分性功能到发挥激励性功能
相关文章:
下期小学班主任工作总结09-24
六年级数学下期末复习计划08-10
2017数学下期中学业水平测试08-16
最新小学数学教学工作总结10-11
下期语文教学工作总结(精选5篇)08-11
六年级下期英语教学工作计划12-13
小学数学教育教学随笔01-20
小学数学教学改进措施05-04
小学数学教学教案模板11-30
小学数学教学工作总结 15篇01-14
上一篇:老年人奶粉选什么好?2022年十大老年人奶粉推荐
下一篇:请问:一个成年人每天所摄入的食物的热量不能 – 手机爱问
最近更新娱乐资讯
- 获奖影评赏析|《阿丽塔·战斗天使》
- 人生必看十部好看的纪录片(十部必看的现实主义纪录片)
- 日本十大禁欲动漫盘点:唯美霸道下的污镜头
- 墨西哥大麻即将合法化,美媒:美国夹在两个“卖大麻的邻居”之间
- “和合”文化背景下昭君文化的价值生成
- 马来酸阿法替尼片人体生物等效性试验
- 原创《满城尽带黄金甲》:喧哗与沉静的戏台,道德与伦理的悲歌
- 裴旖旎
- 隐适美附件又掉了,从第一天掉了2颗,第二天掉了1颗,今晚我还戴牙套吗?
- 电视剧《最美的青春》:好作品是如何炼就的
- 狗头萝莉出摊卖煎饼大家怎么看?
- 记者的职业伦理:我该何时放下相机
- 绝命毒师电影,「蚁人」改造DNA,首部Netflix华语剧...10月流媒体片单
- 这是一部非常独特的「成人动画」,少儿不宜
- 高分电影推荐!六部直击人性黑暗面的韩国片!部部引人深省!
- 2022天津解放军464医院整形美容中心整形价格表(价目表)全新发布
- 精 [电影推荐]一再婚女人因拯救女儿,让两个家庭面临人性考验,此电影令人感动
- 缓冲晶体溶液与生理盐水对重症监护病房患者急性肾损伤的影响:SPLIT随机临床试验
- 未成年人千万别看这部片子,简直太变态了!!!
- 生态在文学中的位置
- 与3800多名女性发生过关系,世界小电影之王,终于那啥了
- 新加坡电影《爸妈不在家》爆冷获多项金马奖
- 调查称52%受访者认为国产电影色情暴力问题严重
- 红楼梦初中读书笔记
- 家庭伦理剧,小品剧本《家庭矛盾》