美國麻省理工提出「嬉戲評價系統」,專門評價孩子的軟實力

蜂窩兒童大學 發佈 2020-01-17T18:08:29+00:00

③Maker Ed是一個位於美國加利福尼亞州奧克蘭市的非盈利性組織,致力於促進平等、包容以及真正能幫助學生應對世界和解決實際需要的教育。

多年以來,對於標準化考試評分系統的批判之聲不絕於耳。特別是在國內「一考定終身」的背景下,似乎人們已經習慣了把教育系統中的所有問題都歸罪於「考試」和對於「分數」的追求:


孩子學習壓力大成為了「考試機器」?是標準化考試的錯。

家長們唯「分數」至上?是標準化考試的錯。

學校教學負擔重、沒法推行素質教育?是標準化考試的錯。


批判是很容易的,改變卻很難。


特別是在教育這樣一個關係到社會的方方面面、牽扯到太多利益相關者的領域,我們絕不應該把改變想像成去蕪存菁的簡單加減法,而應該是牽一髮則會動全身的綜合考量。


在改進傳統的標準化考試評價體系的呼聲越來越高的今天,MIT的「嬉戲評價系統」或許是可行的替代策略之一。


這個體系目前所展現出來的一些問題也需要理性地看待。


比如如何平衡標準化和個性化?評價體系的意義不僅僅是記錄學生的成長進步和評估學生的學習成果,同時也是選拔人才時的重要參考。


那麼這種個性化的評價指標如何在公平公正的話語體系中為機構和企業提供有效的選拔標準恐怕還有待進一步研究。

(部分企業在篩查簡歷時,對於應聘者在簡歷中所展現出來的能力也會使用評分系統來提高效率。圖片來源:UCL Careers Essentials Online)


在這篇文章中,除了介紹到MIT最前沿的教學設計項目以外,也能看到國外科研學術和教學實踐的緊密結合,在這方面,中國能做得還有很多。


在這樣一個人工智慧正在以極快的速度向生活的各個領域擴張的時代,人們越來越相信和依賴外在的系統和機器帶來的便利和那種絕對中立和理性的感覺。


或許不應該擔心人工智慧是否真的會具有人類的智能,而更應該擔心人淪為工具和機器。


而幫助和引導人成為人,永遠是教育的終極目的。這樣來看,對於傳統標準化考試評價體系的改變,既是教育變革中的一大步,也是人類一次新的「文藝復興」的一小步。


【正文】


我們準備好改進標準化考試評價體系了嗎?這些MIT研究者認為是的


本文介紹了麻省理工學院(下文簡稱MIT)的研究者是如何通過設計嬉戲評價體系(playful assessments)來評估學生們的學習成果,在後續文章中,我們將會具體介紹一所學校的試驗案例。


近年來,教育工作者們花了數不清的時間來設計、試驗和推廣各種有趣又吸引人的學習形式,比如項目制學習(project-based learning)、遊戲制學習(game-based learning)等。


然而,相關的評價體系卻還在原地踏步。因此,學校希望學生們掌握的能力和他們用評價系統評估的能力之間存在著嚴重的脫節。不過,這也不能完全怪學校,因為很多重要能力確實是很難量化評估的。


為了解決這個問題,MIT的一個研究團隊決心要設計一個真正能夠評估學生在非傳統學習環境下產生的學習成果的評價體系。他們把它叫作「嬉戲評價體系」。這裡需要注意的是,「嬉戲評價體系」與遊戲化(gamification)不同,前者是試圖在難以進行傳統靜態評估的學習環境中衡量學生對於某項學習內容的掌握程度,而後者則是指把遊戲設計的元素和遊戲規則應用於非遊戲的情境中。


擁有遊戲設計經驗的MIT研究負責人路易莎·羅森赫克(Louisa Roseheck)介紹說,這個想法是為了能夠評估「所有我們真正在乎但是在傳統評價體系中沒辦法評估的能力,比如好奇心、創造力還有批判性思維能力。通過把評價體系『嬉戲化』,我們或許就可以更好地評估這些我們真正希望學生擁有的重要能力」,她繼續說道,「嬉戲評價體系的好處就在於它不會打斷學習的節奏和過程,從而減輕學生們對考試的焦慮,孩子們甚至不必知道他們正在被評估。」


MIT的研究員金允正(Yoon Jeon Kim)補充道,「不僅僅是學生們很怕那種傳統的考試,老師們在使用這種標準化測試的時候也很焦慮。但是他們別無選擇。嬉戲評價系統則和傳統的那種古板嚴肅的考試方式完全不同,我覺得它可以真正改變學校教育。」


那麼,嬉戲評價系統究竟是什麼呢?正如羅森赫克設想的那樣,嬉戲評價系統很大一部分取決於自我反饋(self-reflection)和同伴互評(peer evaluation)。她解釋道,「我們希望學生能夠知道什麼樣的學習是高質量的,這樣他們在學習時就會清楚該怎麼去學、該學些什麼。但是這也需要老師們設計相應的學習體驗來嵌入這個評價系統,而且評價系統的內容也需要教師們根據教學內容來量身打造。」


MIT教學系統實驗室(TSL, Teaching Systems Lab)的研究人員多年來一直在進行這項研究工作,但是直到去年才把這個新的評價體系命名為「嬉戲評價系統」。到目前為止,他們已經開展了不少關於這個新的評價系統的試驗項目,比如幫助教師們設計更好的課堂活動來配合這個評價系統,以及將評價系統在個別學校的試運行等等。


給「評價指標」建立評價指標(Going Meta on Building Rubrics)

實驗室的研究人員很清楚,雖然大多數人都意識到了標準化考試的局限性,但是他們仍然用這種方式去評估學生們的學習成果,因為除此之外,他們也沒有什麼別的選擇。所以MIT的這個項目的意義就在於可以為教師們提供一種新的選擇。


對於那些尋找可以取代標準化考試的評價系統的教育工作者而言,建立評價指標(rubrics)一直是一個很受歡迎的思路和方法。任何人都可以根據所進行的項目或者主題而構建它們,這樣他們就不需要被和學習過程完全不相干的考試和分數所束縛。但是,建立有效的評價指標並不是一件簡單的事,特別是被評價的內容是那些像是創造力和開放性思維能力這樣的非學術性的能力時。


MIT的研究人員希望能夠幫助教師們制定更有有效的評價指標來衡量那些難以量化的領域,所以他們研發設計了一個叫做「超越性評價指標」①(MetaRubric)的活動,希望以此來保留學生們學習和參與評價的趣味性,同時也能讓教師們感到輕鬆。


具體來講,「超越性評價指標」就是「紙牌遊戲+討論」的遊戲。比如說,在進行「超越性評價指標」的活動中,玩家們(被評價對象)會被要求完成一個簡短的開放性的創意項目,然後他們會建立評價指標以評價自己的項目。但是,我們如何知道這些「評價指標」是有效的,而不僅僅是學生們為了偷懶或者僅僅是為了有趣而隨便建立的呢?這時候就需要再通過不同的互動、合作等活動,討論並並最終共建一個共享的「超越性評價指標」,即,一個用來「評價什麼是好的評價指標」的評價指標。

(「超越性評價指標」資源,圖片來源:MIT TSL)


對於學校而言,認識到傳統評價體系的弊端是一回事,而找到並使用一種替代的評價體系來評估學生們在學習過程中的進步又是另一回事。目前,已經有分別位於加利福尼亞州和維吉尼亞州的兩所學校正在參與MIT的試驗項目,積極在他們的學校中使用並推廣嬉戲評價系統。


嬉戲評價系統的試運行

以創造者為中心的學習(maker-cantered learning)②是一種鼓勵修補漏洞(tinkering)、主動出擊(hacking)、自主創建(building)等實踐能力的學習方式,這種學習方式能夠培養學生的創造力、解決問題的能力以及學習的自發自主性(agency)。但是,目前很少有評價體系能夠評估學生們在這種學習過程中所習得的這些能力。


通過MIT和Maker Ed③(MIT的一個非盈利性合作夥伴)的合作觀察和評估,以及國家科學基金會(NSF,National Science Foundation)的資助,兩所不同的學校正在使用這個新的評價系統來評估學生們的動手操作能力。


Maker Ed的相關負責人史蒂芬妮· 張(Stephanie Chang)介紹道,「我們選擇了兩所完全不同的中學,這樣我們就可以有足夠的證據說明我們設計的這些評價工具和方法可以適用於任何類型的學習環境。」(由於NSF的撥款期限和範圍,他們僅限於在兩所學校中進行試驗。)


其中一所是位於加利福尼亞州聖馬特奧市的公立K-8學校——科特·馬德拉學校(Corte Madera School)。他們正在試驗MIT的這個新系統,來證明傳統的公立學校是否可以、以及如何使用嬉戲評價系統。科特·馬德拉學校對於普遍的必修課程使用傳統的課程設計和評價體系,擁有標準化的授課周期。硬體設施方面,除了普通的教室等,還有一個共享的實體手工空間可以讓學生們在午餐、休息或者由教師帶領下使用。


另一個學校是位於維吉尼亞州夏洛茨維爾的社區公共特許學校④(community public charter school)——社區中學(Community Middle)。這所社區中學是阿貝馬勒(Albermale)縣學區的一所新興實驗學校,因此羅森赫克認為這裡有試驗嬉戲評價系統的理想條件。在這所社區中學中,傳統的打分系統和成績單已經被淘汰,各個年級之間的級別劃分也幾乎被取消了。一群學生們在同時進行著完全不同的學習項目的情況在這裡也很常見。一個學生可能在走廊里彈鋼琴,另一個學生可能在隔壁的教室里製作模型引擎,還有的學生可能在正在實驗室里使用電鑽……這些學生們很少參加那種全是選擇題的標準化考試。相反,他們會參加各種鍛鍊動手能力的項目,通過這樣的學習方式,他們要麼掌握某種目標技能,要麼不能掌握。


MIT和Maker Ed以及兩所學校正在合作試驗「嬉戲評價系統」中的七種不同的評估工具和方法,希望能夠說明創造者教育(maker education)不僅很有吸引力,而且也很有效。(具體的試驗項目詳情將在本系列的第二篇文章中具體介紹。)


在嬉戲評價系統之後會是什麼?

羅森赫克、金以及他們團隊中的其他人會繼續組織各種工作坊來推廣並試驗他們的嬉戲評價系統。他們的團隊目前正在開展第三個項目:一個新的數字化、遊戲化的評價系統,它可以用來評估學生對各種學科性知識、以及像是幾何空間推理能力、恆心和創造力等認知性及非認知性技能的掌握程度。研究者們相信,這個評價系統將可以取代包括數學考試在內的很多標準化考試形式。


羅森赫克說道,傳統的標準化考試評估系統幾乎被廣泛地使用在所有形式的教學中,教師們雖然或許也對傳統考試感到反感,但他們已經習慣了。因此,羅森赫克和她的團隊已經充分預料到在推廣這種沒有分數、沒有優良中差的嬉戲評價系統時會遇到的各種阻礙了。「我認為,在可預見的未來,最好的評價體系應該是既能讓教師們感到具有挑戰性,又能讓他們感覺很舒服。」但她同時也承認,學校和教師需要更多的支持來將這些研究成果轉化為某種「成績」(grade)或者其他形式可以用於相互交流對比的記錄。


然而,對於最為先進的學校而言,這些擔心完全是多餘的。阿貝馬勒的那所特許中學就是一個很好的證明。羅森赫克已經在這裡建立了相關的試驗學校,同時她也承認:「這是一個大膽但是有些激進的主意,但是,它正朝著我們所期望的未來學校教育的樣子前進」。


①相關連結:https://tsl.mit.edu/project/metarubric/

②即下文提到的創造者教育(maker education)。這種學習理念的理論支持來自於以讓·皮亞傑(Jean Piaget)和西摩爾·派波特(Seymour Papert)為代表的建構主義(constructivism/constructionism)。該理論學派強調通過以互動性、開放性和學生驅動性為主導的多學科體驗來培養學生的創造者意識,這種多學科交叉的學習體驗能夠讓學生們通過運用自己的想像力、設計思維和動手能力來完成項目,以此來真正培養學生們在實際應用中所需的能力。創造者教育還可以培養學生的深入學習能力以及適應力(resilience),以幫助學生們在未來的工作中更好地進行知識創造和知識共享。因此,創造者教育的理念不僅僅是培養學生未來所需的個人能力,同時也包括如何與他人、社區、社會連結的意識。

③ Maker Ed是一個位於美國加利福尼亞州奧克蘭市的非盈利性組織,致力於促進平等、包容以及真正能幫助學生應對世界和解決實際需要的教育。我們相信創造者教育(maker education)的理念有能力為每個學生實現這樣的教育目標,無論他們的階級、性別、人種、能力或是所屬地區。相關連結:https://makered.org

④特許學校是一種美國的中小學學校,通常受制的相關規則比較少,同時也會比公立學校得到較少的資金支持。


原文標題:

Is Assessment Ready to Move Beyond Standardized Tests? These MIT Researchers Think So.

文章來源:EdSurge

原文作者:Emily Tate

關鍵字: