當前位置: 華文世界 > 教育

大學英語教材形成性評價活動研究

2024-02-10教育

感謝您關註「永大英語」!

大學英語教材形成性評價活動研究

楊莉芳

提要: 形成性評價是教學的重要組成部份。本文探究大學英語教材中形成性評價活動的頻度與特點。研究發現:1)所分析教材均包含形成性評價活動,頻度存在較大差異;2)形成性評價活動都強調獲取與評價學習表現,但半數缺少後續促學行動環節;3)大多數形成性評價活動具備明確的評價標準,主要以語言能力為評價內容;4)絕大多數形成性評價活動的主體為學生,教師的作用以及為教師提供的指導建議相對不足。據此,本文進一步討論大學英語教材中形成性評價活動設計的關鍵問題,為未來教材編寫與教學實踐提供參考建議。

關鍵詞: 大學英語教材;形成性評價;外語教學

1. 引言

形成性評價既是一種測評行為,也是課堂教學活動的一部份,是指對所獲取的學生的學習表現證據加以分析解釋,從而得出結論指導下一步學習和教學的過程(Black & Wiliam 2009)。形成性評價對教學的促進作用,得到了大量實證研究的驗證(如Black & Wiliam 1998;Wiliam et al. 2004),結論是執行得當的形成性評價活動可以令學生學習效率成倍增長(Wiliam 2007)。國內大學英語教學領域對形成性評價的重要性已有相當深刻的認識(楊滿珍、劉建達 2019),形成性評價已納入【大學英語教學指南(2020版)】(教育部高等學校大學外語教學指導委員會 2020)。由於目前大學英語教學實踐很大程度上是基於教材展開,課程內容、教學設計與教學實施均圍繞教材開展,教材中形成性評價活動的設計情況將直接影響教學中的形成性評價實踐。本文聚焦10冊大學英語教材,探究教材中形成性評價活動設計的特點,以期為未來外語教材的編寫以及教學實踐提供啟示。

2. 文獻綜述

不同於終結性評價的大規模、標準化考試,形成性評價發生於教學過程中,以促學為目的(Bloom et al. 1971)。Black & Wiliam(1998)基於對250篇形成性評價研究的元分析,發現形成性評價對學習具有巨大促進作用,此後形成性評價在世界範圍內得到廣泛的實踐和研究。研究一方面聚焦評價的某種形式,如同伴互評(Yu & Hu 2017;周季鳴、束定芳 2019),或某個環節,如反饋(Zhang 2020;牛瑞英、張蕊 2018),探究評價的促學機制;另一方面以技能為線索,探討教學中的形成性評價實踐(如Ranalli 2018;田朝霞 2018)。

大學英語教學情境下的形成性評價是國內研究關註的重點(楊滿珍、劉建達 2019),一些實證研究基於真實課堂,總結出了具有借鑒與推廣意義的特點(如楊華、文秋芳 2014)。然而,也有研究發現,教師普遍缺乏評價培訓與相關支持,難以順利開展形成性評價活動,因而很難達成評價的真正促學效果(Stiggins 2002;江進林 2019)。調查表明,高校英語教師的整體測評素養偏低(江進林 2019)。作為教學最重要的工具,教材對教師與教學的指導作用毋庸置疑,且研究發現,教師在使用教材時很少改編教材已有的活動(張虹等 2021)。因此,形成性評價活動是否充分、是否有效地包含在大學英語教材設計中,直接影響甚至可能決定教學實踐中形成性評價的開展情況。已有學者強調將形成性評價納入教材的重要性(胡壯麟 2005;鄭曉紅 2018),指出教材應培養學生自主學習能力,教材活動設計應註重給予學生自我評估的空間。但目前尚未有針對形成性評價活動的教材實證研究。鑒於此,本文將探究大學英語教材中形成性評價活動的特點,並對各冊教材進行分析與比較。

3. 研究設計

3.1 研究問題

本文具體研究問題包括:1)大學英語教材中是否設計了形成性評價活動?若是,頻度如何?2)大學英語教材中形成性評價活動設計呈現什麽樣的特點?

3.2 研究物件

本文的研究物件為國內10冊主流大學英語教材綜合教程第一冊學生用書與教師用書(包括教師用書的原因在於,學生用書中一些練習活動的評價標準、實施評價的步驟等資訊會透過教師用書提供)。教材的選取遵循下列原則:使用面廣,既有經典教材又有近期出版的新教材,包括不同出版社出版的教材。最後選定的教材資訊見表1,教材名與出版社名稱均用字母代替。

3.3 數據收集與分析

本研究收集了10冊教材中學生用書中除輸入性文本外的所有練習活動,以及對應的教師用書中對活動的教學建議作為研究數據。

數據分析的編碼框架(見表3)結合了形成性評價理論以及對本研究數據自下而上的分析。該框架基於語言測評界對形成性評價活動基本要素的研究成果(Boston 2002;Gu 2021;Heritage 2007),確定評價活動的五個要素為:1)明確目標,即點明學習的具體目標是什麽;2)獲取表現,即透過設計任務來獲取學生的學習表現;3)評價表現,即對所獲取學習表現的質素進行評估與解釋;4)提供反饋,即報告表現的評估結果、提出建議;5)促學行動,即根據反饋采取後續行動促進學習表現的提升。每個要素下包括的具體維度指標來自對本研究數據的紮根理論分析。

基於上述編碼框架,筆者首先對一位有經驗的編碼員(語言測評方向碩士畢業生,曾參加三項語言測評研究的編碼工作)進行編碼培訓,然後由兩位編碼者獨立編碼,在編碼過程中共同商討對方提出的不確定之處。編碼者間信度檢驗Cohen’s kappa系數為0.92,符合標準,編碼不一致之處在商討後確定。

4. 研究發現

完成對所選教材中形成性評價活動的分析後,本文圍繞兩個研究問題,從形成性評價活動的頻度與特點來報告研究發現。

4.1 形成性評價活動頻度

10冊教材都包含形成性評價活動,共88項,但每冊教材的形成性評價活動頻度存在顯著差異(見表2)。其中,3冊教材(A、D、E)平均每單元一項形成性評價活動,4冊教材(C、F、G、I)平均每單元不足一項,3冊教材(B、H、J)平均每單元超過一項。形成性評價活動頻度最高的教材J平均每單元超過四項活動,頻度最低的教材G全冊共兩項活動、平均每四個單元一項。出版較早的教材A(2012)與教材B(2010)平均每單元約一項形成性評價活動,最近出版的教材J(2021)平均每單元約四項,盡管沒有線性相依,新近出版的教材有可能更註重形成性評價活動的設計。

教材的形成性評價活動中,各要素分布不均衡:所有活動均包含「獲取表現」與「評價表現」,95%的活動包含「明確目標」,92%的活動包含「提供反饋」,僅51%的活動包含「促學行動」。若以具備所有五個要素才構成完整的形成性評價活動為標準(顧永琦、李加義 2020),則僅有半數形成性評價活動達標,10冊教材共76個單元,僅包含45項完整的形成性評價活動。

4.2 形成性評價活動特點

透過統計每個要素下各指標頻數的情況,我們可以得出教材中形成性評價活動的主要特征(見表3):評價的目標絕大多數基於具體任務,任務形式以書面產出為主,對任務表現的評價基本具備明確的評價標準,評價標準的內容以語言能力為主導,半數評價活動要求提供開放式的評論和建議作為反饋,半數評價活動包含後續促學行動,行動目標主要是提高任務表現。

關於要素一「明確目標」,絕大部份評價活動是基於具體任務目標的(82.1%),目標形式主要有兩種:一是出現在任務要求中(59.5%),如教材D的一項寫作任務「writing a letter of congratulation」的要求為「choose the right form and tone, stay focused on the theme of congratulation」;二是在步驟指導中逐漸呈現(27.4%),這種形式的目標往往更為具體,發揮了評價目標與學習腳手架的雙重作用,如教材H的一項評價活動「giving a presentation on digital shopping on campus」共有四個任務步驟,其中Step 2 develop your ideas 給出具體指導及三專案標「list the most common ways of digital shopping students use on campus, think about the impacts of digital shopping on college students, collect supporting details (facts, data, etc.)」。還有一部份評價活動以單元學習目標為評價目標(16.7%),如在單元開頭列出(19.0%)「I can write an essay describing my experience of ‘learning to become local’」的學習目標,在單元學習結束時進行評價。值得一提的是,僅一項評價活動以課程學習目標為評價目標(「Evaluate and categorize your learning features under the headings below: strengths, weaknesses」,教材J),屬於課程教學目標中的學習能力,在該教材前言中有明確列舉。

關於要素二「獲取表現」,即透過設計具體任務來獲取學生的學習表現,具體任務表現以產出型任務尤其是以書面產出(50.0%)為主,如寫一封信、寫一篇介紹性短文等。獲取單元學習表現的形成性評價活動數量不多(15.9%),均設定於單元末,學生完成單元學習後基於單元學習目標對學習表現進行自評(僅教材A、教材J)。獲取階段性學習表現的形成性評價活動數量少,但很有特點,分為兩類,一是分別完成前半學期和後半學期學習時的階段性測評(僅教材B、教材C),二是對之前學習特征的自我評估(僅教材J)。

關於要素三「評價表現」,絕大多數評價活動具備明確的評價標準,針對具體任務表現的評價活動,其評價標準常常以checklist的形式出現,既有針對此項任務的具體標準(如We have included the most important information about digital shopping on campus),又有針對一類任務的通用標準(如演講中voice is clear and loud enough),前者常常與要素一中的目標相關聯。92.0%的評價活動以語言能力為評價內容,關註思辨能力、跨文化能力和學習能力的評價活動很少。除7項評價活動未指明評價主體外,其他活動主要為學生自評(48.9%)、同伴互評(50.0%)以及少數教師評價(18.2%),有一些活動疊加這幾種形式,如運用同一個評價標準先自評再互評。

關於要素四「提供反饋」,在所提供反饋內容中,半數反饋為開放式內容(50.6%),即評價者對被評價者的學習表現提供評論和建議,其次是依據給定標準逐條判斷完成的程度(46.9%,如判定完成度屬於好、中、差哪個級別)或判斷是否完成(29.6%),屬於封閉式反饋。另有5項活動的反饋為給學習表現打分,或評選出最佳(如vote for the best presentation)。接受反饋資訊的物件主要是學生(91.4%)。

關於要素五「促學行動」,具備此要素的評價活動共45項,其中93.3%指明學生要采取後續行動,20.0%具備教師行動,僅6項活動要求學生與教師都開展後續促學行動,教師行動主要表現為答疑。促學行動目標以提高任務表現為主(57.8%),如要求學生依據評價結果修覆寫作初稿。有的評價活動由於其要素一是單元學習目標,因此促學行動的目標相應地是學習行為(17.8%)(如figure out what you need to improve and how you can improve it)或已學內容(17.8%)(如review the p which you found difficult)。有3項評價活動建議教師根據評價結果做出相應教學策略的調整(6.7%)(如If students find this activity difficult, the teacher may ask them the following hypothetical questions)。

5. 討論

基於上述研究發現,並結合對具體數據的分析,本研究從以下四個方面探討大學英語教材在形成性評價活動設計中的一些經驗和不足。

第一,形成性評價的實作途徑。總體來看,形成性評價活動已成為大學英語教材必備的教學活動,所研究的教材均設計了顯性的形成性評價活動,但較早期的教材受到終結性評價設計思路的影響。如出版於2010、2014年的教材B和教材C,主要評價活動為兩次階段性測評,采用全國大學英語四級考試形式的試題。新近出版的教材更能體現教學評一體化的特點。如2018年出版的教材H,每單元的Unit project均包含要素完整的形成性評價活動;2021年出版的教材J的形成性評價活動頻度最高,做到了逢產出必評價,評價囊括從小任務到大專案以及單元學習各層面的表現。

第二,形成性評價的能力目標。10冊大學英語教材的形成性評價活動以書面產出表現為主。然而,除書面表達外,口頭表達以及閱讀和視聽理解能力也都是語言能力的重要組成部份,因此亦有必要開展形成性評價。教材H中形成性評價活動所涵蓋的語言能力就比較均衡,其輸入型任務的形成性評價活動采用基於輸入材料的開放式問題收集學生的表現,再透過教師用書提供評價的標準與後續促學行動方案。10冊教材形成性評價活動主要以語言能力為評價內容,較少關註思辨能力、跨文化能力和學習能力。後幾項能力同樣是大學英語課程的重要教學目標,學界近年也非常關註如何實施相關教學與測試(如孫有中 2016;楊莉芳 2018),因此,這幾項能力的形成性評價有待加強。

第三,形成性評價的要素。基於研究發現,大學英語教材中形成性評價活動的五要素分布不均衡,「提供反饋」與「促學行動」這兩個要素值得特別註意。評價活動所設計的反饋中有三分之一為分數或者是否判定,而所有活動中僅有半數具備促學行動。Davison & Leung(2009)指出形成性評價的兩個基本功能是知會(informing)與形成(forming),分別透過提供反饋與促學行動來實作。好的反饋應提供準確可靠的評價結果以及足量的資訊。籠統的分數所提供的促學資訊非常有限,而是否判定往往不能準確反映真實情況。因為對學習表現的評價不是在好和差(或有和無)中二選一,而是評估達到何種水平、離目標還有多少距離。同時,反饋後的促學行動非常重要,「應根據評估結果采取後續行動,只有反饋資訊被用於改進學習時,反饋才能發揮形成性作用」(顧永琦、李加義 2020:36)。

第四,形成性評價的教師主體。教師在評價活動中具有重要作用,前提是教師懂得如何組織評價活動、開展評價。教師用書是為教師提供支持和指導的有力途徑,但10冊教材的教師用書在形成性評價活動設計中的作用差異較大。僅半數(教材D、F、G、H、J)提供形成性評價活動的相關內容,包含三類情況:一是將學生用書中的活動步驟與評價標準換成教師視角展示,幾乎無新增內容;二是學生用書僅呈現任務要求,由教師用書補充教師組織評價活動的步驟與評價標準;三是任務要求與自評標準在學生用書中列出,教師用書提供互評和師評的指導步驟與評價標準以及後續促學行動的建議。第三類情況能較完整地覆蓋形成性評價活動的要素,對教師開展教學實踐的指導與借鑒意義更大。

6. 啟示與建議

在前文對研究發現進行探討的基礎上,我們獲得了關於形成性評價活動設計的一些啟示,從而嘗試提出未來在教材編寫與教學實踐中發展形成性評價活動的幾點建議。

首先,應提高形成性評價在教學活動中的占比,促進評價與教學的有機融合。實作教學評一體化,應將評價作為完整教學活動中的必備環節,透過評價來診斷與反饋教學目標的完成情況,並以此為依據確定下一輪教學的行動計劃。在教學設計中,二者的有機融合既可以相對隱性,也可以比較顯性。例如透過評價環節串聯起系列學習活動形成完整的活動鏈,一個單元內第一階段產出任務完成後,第二階段任務可先評價和修改第一階段任務的產出,然後進一步添加元素生成新的產出任務。還可將必要的評價素養如反思與評價能力設計為教學內容,學生透過對形成性評價能力的顯性學習提高評價素養。

其次,應豐富形成性評價的能力目標,實作對語言能力、思辨能力、跨文化能力等綜合能力的促學效應。當前外語教學以發展多元能力為目標,因此形成性評價必然在語言能力基礎上融合多元能力與素養目標,既可以體現為具體任務的設計,也可以對一個單元進行整體設計。前者尤其要結合某項任務的目標與內容,為任務表現制定具體評價標準(楊莉芳、王婷婷 2022),例如針對一項跨文化寫作任務,不僅應評價任務產出的內容、結構和語言等,還應該評價其中涉及的跨文化知識、技能與態度(Deardorff 2006)。後者需要對整個單元進行一體化設計,可在完成單元學習時讓學生進行自評,評價標準中納入思辨能力、跨文化能力、學習能力細化的子技能以及具體的思政育人目標,而單元開頭的學習目標中就應列出各項子技能和具體目標,透過單元學習加以培養再進行評價,透過教學評貫通的方式實作多元能力培養目標。

再次,應重視評價中的有效反饋與後續促學行動,建立學、評、知、行的良性迴圈。目前多數評價活動尚囿於利用評價工具探知學生表現,對反饋的重視不足,導致缺乏反饋或反饋單一(分數或等級)或單薄(簡單判定)。有效反饋必須具有充分的診斷性。因此,建議避免籠統的描述語,或在學生作為評價主體的情況下任其隨意點評。在學生開展評價時,應提供評價的具體方向,可采用回答評價問題的形式,或讓學生基於標準細則給出評價並列出具體的證據,既促進學生對學習現狀和目標的深入思考,也有利於生成真正有效的反饋。基於有效反饋,還須設計後續行動的步驟,以及針對可能的行動結果,設計進一步評價的方案,實作教學評的迴圈發展。

最後,應加強教師在評價中的作用,提升教師的評價素養和評價實踐。一方面,教材編寫應加強教師端設計,為教師的形成性評價實踐提供更多指導與支持。有效的設計包括結合本冊教材總體教學目標和內容提供形成性評價的基本思路,結合每單元教學設計提供形成性評價活動鏈,以及結合每項具體教學任務提供形成性評價的步驟、標準及操作建議。另一方面,必須認識到教師在評價活動中肩負多重角色,教師有時是評價主體,須掌握評價學生表現與教學效果的有效方法;當評價主體為學生時(自評、互評),教師是評價活動的引導者,須為學生搭建評價活動的腳手架、跟進過程與結果、推動評價活動發展;教師亦是評價活動的設計者,可基於所使用的教材,利用已具備的形成性評價要素,補齊所缺失的要素,根據教學評一體化的原則開展形成性評價活動。

7. 結語

本文分析了10冊大學英語教材綜合教程第一冊中形成性評價活動的設計情況,發現所有教材均包含形成性評價活動,但頻度與特點均存在差異,較早出版的教材中形成性評價有較明顯終結性評價的痕跡,新近出版的教材中形成性評價活動頻度更高、更能體現教學評一體化的理念。總體來看,形成性評價活動更強調獲取表現和評價表現,在提供反饋與促學行動方面有較大提升空間。本研究的發現為我們提供了發展大學英語教學中形成性評價的基本思路,包括提高評價活動的頻度,促進評價與教學活動的融合,拓展評價目標涵蓋多元能力,強調反饋與後續行動,以及賦能教師的評價實踐。

本研究所分析的教材均為傳統紙質教材,未來可以關註紙數結合的新形態教材(楊莉芳 2023)中形成性評價活動的設計與實作。新形態教材基於智慧教學平台,能夠利用數碼資訊科技收集教與學的全過程數據,分析學習者學習表現、行為特征、能力現狀等,在透過評價賦能教學決策方面獨具優勢,將會推動形成性評價進入新紀元。

(參考文獻 略)

(本文首次發表在【外語教育研究前沿】2023年第4期)