返回首页
当前位置: 主页 > 基础教育资源 > 其他大全 >

国外科学探究能力评价研究综述

时间:2012-09-13 13:11来源:知行网www.zhixing123.cn 编辑:麦田守望者

我国基础教育课程改革把科学探究作为重要教育目标,但教师还是热衷于通过纸笔测验来评价学生的科学探究能力,这如同用旧尺子衡量新事物,使探究教学遇到了严重瓶颈。从20世纪60年代国际科学课程改革以来,国际科学教育界一直在探索科学探究能力的评价方式。除了效度最高、但成本也最高的观察方式外,还开发了工作单、计算机模拟、纸笔测验等替代方式。本研究考察了这几种评价方式的特点,以及替代方式与观察的可交换性。

 

  一、评价科学探究能力的各种方式

 

  1.观察

  所谓观察就是教师对学生的探究进行直接观察,并根据预先制定的评分标准进行评价。一般采用一(教师)对一(学生)甚至二对一的观察。

  在一些大规模评价中,受直接观察所需的人力、物力、时间等高成本限制,观察的往往是一些花时间少的部分过程,很少观察完整的探究过程。例如,在英国,有大规模评价科学探究能力的传统,但也主要是通过观察来评价学生低水平的操作和观察技能。

  在小规模的观察评价中,研究者首要考虑的不是成本问题,而是评价的效度和信度,为此必须制定明确的观察指标和评分标准。不同研究者制订的观察指标、评分标准及其具体程度不一样,如Lunetta等人(1981)拟定的观察指标包括设计、操作、观察、数据转换和解释等,这些指标抽象、宽泛,优点是迁移性强,适合于不同的观察任务,缺点是不同的评分者使用起来会有偏差,评分者信度不高。针对这样的问题,一些研究者根据具体的探究任务制定明确、具体的观察指标和评分标准,如Baxter等人(1992)在让学生探究“不同品牌纸巾的吸水量”时,分别从浸湿纸巾的方法、纸巾是否饱和、怎样测量纸巾中的水量、是否细心、是否能得出正确结论等方面进行观察和评分。虽然这些具体的观察指标的可迁移性差,但由于针对性强,减少了评价的随意性和主观性,以至评分者信度、概化系数都很高。

  2.工作单

  工作单就是让学生把探究的过程和结果记录在工作单上,然后教师根据评分标准来进行评价。按照提示程度来划分,工作单有三种类型:第一种是无提示的开放性工作单,要求学生把探究过程和结果写在空白的工作单上;第二种是一般提示的结构性工作单,要求学生按照提示的结构来描述探究过程和结果;第三种是充分提示的具体工作单,它针对具体探究任务一步步地引导学生探究并写在工作单上。显然,第一种工作单适用于不同探究任务,其开放性有利于学生创造性、灵活性的发挥,但对中下水平学生可能不利,同时评分者也难以准确把握评分标准;第二种工作单也适用于不同的探究任务,其适度的开放性适合于大多数学生;第三种工作单只适用于某个探究任务,不同的探究任务需要开发不同的工作单,而且其过度的结构性限制了高水平学生的灵活性发挥,但优点是有利于中低水平学生,也可提高评分者信度。

  由于工作单的运行成本低于观察方式,一个教师可以监考一个班级的学生,因此工作单尤其是结构性工作单在国际上被大量运用。例如,国际教育成就评价协会(IEA)在20世纪进行的三次大规模国际研究(FISSSISSTIMSS)、以及美国的国家教育进步评价(NAEP)、英国的表现评价(APU)等都采用工作单评价学生的科学探究能力。

  3.计算机模拟

  尽管工作单比观察减少了人力和时间,但所需探究器材并未减少,解决这一问题的方案之一是计算机模拟。例如,Shavelson等人(1992)设计了两个计算机模拟情境,让学生探究:臭虫喜好怎样的环境、电路黑箱中的内容。Lazarowitz等人(1993)设计了一个计算机模拟情境,让学生探究影响微生物生长的因素。学生在计算机模拟情境中操作鼠标,计算机自动对学生的操作进行打分。

  计算机模拟开发成本较高,但运行成本很低,可随时随地进行评价,还可即时评分,给出反馈;计算机还保存着学生探究的全部记录,教师或学生可随时回顾探究过程,找出存在的问题,这在形成性评价中比较有用。

  4.纸笔测验

  由于纸笔测验开发和运行等总体成本很低,可以大题量开发、大样本测试,而且评分者信度很高,因此从20世纪60年代到80年代,很多研究者对纸笔测验工具的开发乐此不疲。刚开始时,这些纸笔测验工具主要是针对具体课程的。例如,mcleod等人(1975)开发的测量工具就是针对小学SAPA课程的,用来测量控制变量、解释数据、形成假设和操作定义四个过程技能。

  由于针对具体课程的测量工具无法迁移到其他课程,因此一些研究者开发了一些与具体课程无关的通用测量工具。Molitor等人(1976)开发了测量小学456年级学生推断和证实过程技能的测量工具。Dillashaw等人(1980)开发了著名的TIPS,测试中学生的5个综合过程技能:形成假设、定义变量、控制变量、操作变量、制定探究计划、解释数据。

  由于纸笔测验工具成本低,相对容易开发和运行,20多年的时间已使其成为相当成熟的工具,因此从20世纪90年代以后,很少再有研究者开发类似的工具,转而直接使用TIPS

 

  二、替代方式与观察的可交换性

 

  大量研究表明,对于设计良好的现场观察,评分者能可靠、有效地评价学生的探究能力。但是,由于探究任务的抽样变异很大,一些学生可能在某些探究任务得分高,但在另一些探究任务得分低,因此仅通过一两个探究任务来评价学生的一般探究能力,既不可靠也不公平。然而,多任务的探究对大规模的评价来说,其成本是难以承受的。那么,低成本的工作单、计算机模拟和纸笔测验等替代方式与现场观察的可交换性究竟如何呢?

  1.工作单与观察的可交换性

  在Baxter等人(1992)的研究中,让学生探究哪个品牌的纸巾吸水强,通过现场观察和开放性工作单来评价他们的探究能力。两种评价方式都用同一评分标准对学生的探究步骤进行逐项评分。结果发现,两者在一些步骤的相关系数较高,但在另一些步骤的相关系数较低,这说明开放性工作单在评价某些探究步骤时难以替代现场观察。

  Woolnough等人(1990)研究了开放性、结构性、具体性工作单与观察方式之间的关系,结果发现这三种工作单与观察的相关系数分别为0670807,说明结构性工作单与观察的可交换性最强。Shavelson等人(1992)的研究也发现,开放性工作单与现场观察的可交换性低于结构性和具体性工作单。

  这些结果是令人宽慰的,因为开发一个结构性工作单可用于不同的探究任务,减少了开发成本,而且经常的使用将使学生学到科学探究的一般方法而不是那些支离破碎的细节;具体性工作单开发成本较大,而且过于细碎,破坏了科学探究的整体性,也限制了学生创造性和灵活性的发挥;因此,从成本和可迁移性的平衡来看,结构性工作单不失为一种较好的选择。

  2.计算机模拟与观察的可交换性

  Shavelson等人(1992)分别让学生在真实情境和计算机模拟情境中探究“臭虫”和“电路黑箱”,所用评分标准一样,结果两者相关较低。时隔8年后,Rosenquist等人(2000)再次用“臭虫”和“电路黑箱”来研究实际动手和计算机模拟的可交换性,两者相关也较低,这样的结果使很多人怀疑两者的可交换性。当然,这个结果是否具有一般性,尚无足够的证据来支持,但计算机模拟毕竟是人为设计的环境,与在真实的复杂环境不一样。对于简单的探究,探究步骤比较单一、规范,变异少,计算机能较好地模拟;但对于复杂的探究,程序设计者很难对真实探究的各种变异以及不同学生的各种反应考虑周全。因此,Shavelson等人(1992)认为,如果要测量一个班的探究平均水平,计算机模拟也许可以替代现场观察,但要测量个体的探究水平,计算机模拟难以替代现场观察。

  其实,国内外长期以来的计算机辅助教学(CAI)也早已证明,学生在模拟情境中学会的实验技能并不能很好地迁移到真实的实验中。也许是这个原因,在世界最大的教育类资料库ERIC上,用计算机模拟来评价探究能力的文献比其他三种方式都少。

  3.纸笔测验与观察的可交换性

  尽管纸笔测验很流行,但不少研究者发现它与观察的相关系数低。Lawrenz等人(2000)还进一步研究了不同学术水平学生在纸笔测验和动手探究中的表现,结果发现不仅两者相关系数低,而且中低水平学生在纸笔测验中平均成绩差异显著,但在动手探究中平均成绩差异消失了,即低水平学生在动手探究中表现得到丁明显改善。这可能有两个可能原因:一方面,枯燥无味的纸笔测验难以激发低水平学生的兴趣,但动手探究的有趣情境却提高了他们的动机水平,使他们更努力去探究;另一方面,动手探究没有纸笔测验那样抽象,其认知要求比纸笔测验低,学生能直接操作器材而不是在想象中操作器材。这些结果都说明了纸笔测验与现场观察的可交换性差。

  从以上可看出,与观察可交换性依次降低的是工作单、计算机模拟、纸笔测验。

 

  三、结论和建议

 

  对于科学探究能力的评价,现场观察最有效,但成本也最高,其替代方式——工作单、计算机模拟、纸笔测验的成本依次降低,但可交换性也依次降低,这无疑为我们选择或设计合适的评价方式提供了有价值的参考。

  从理论上讲,要促进科学探究的教学,就应采用与其相一致的评价方式。但一些研究发现,学生的探究水平不仅跟探究任务有关,还跟评价方式有关,不同群体学生在不同的评价方式中表现不一样。也就是说,任何一种评价方式都不具有天然的公平性。因此,不谨慎地使用某种惟一的评价方式可能会使一些学生处于有利地位,而另一些学生处于不利地位。因此,对于科学探究能力评价的设计或选择,既要考虑成本问题、可交换性问题,也要考虑公平问题。将各种评价方式结合起来使用,为不同群体学生提供展示各自潜能、长处的平台,也许能更可靠、公平地评价学生的探究能力。在我国现实情况下,以纸笔测验为主,以工作单为辅应该是一种现实的方案。

------分隔线----------------------------
标签(Tag):科学探究能力
------分隔线----------------------------
推荐内容
猜你感兴趣
博聚网