我還沒考試，算法就說我的物理一定掛科

來源 | HyperAI超神經

責編 | Carol

封圖 | CSDN 下載自視覺中國

大學物理是理工科學生的基礎必修課程，但也因為有一定的難度，令很多學生望而生畏。研究人員提出了用 AI 算法預測，哪些學生物理課有掛科風險，好讓老師更好地進行教學指導和調整教育資源的分配。

不得不說，算法的預測能力越來越強，小到預測夫妻是否會吵架，大到預測地震洪水等何時發生。

現在，算法甚至連你的物理課會不會掛科，都能預測出來。

這是最近西維吉尼亞大學和加州理工大學的學者們，在 arxiv.org 上發表的一項最新研究。

他們發表了一篇有趣的論文：《Using Machine Learning to Identify the Most At-Risk Students in Physics Classes》（《使用機器學習來識別物理課上，最有掛科風險的學生》）。

論文中表示，通過機器學習算法，可以評估物理基礎課中學生的畢業成績，該預測模型將學生分類為成績 A、B、C、D、F 和 W（退選）。

註：美國大部分院校採用的評分等級與百分制分數對應規則大約為：A：90+；B：80+；C：70+；D：60+；F：不及格；W：退選課程（Withdrawal 的簡寫）。

預測成績：敲響警鐘，你還可以搶救一下

還記得被大學物理支配的恐慌嗎？

對很多理工科學生來說，大學物理的難度係數與高數相當，是最讓人頭禿的科目之一。

國外一項研究顯示：曾主修工程和科學（統稱為 STEM）但最後轉專業，或者沒能拿到學位的學生中，其中一小半的人就是因為物理和數學等主修課程，實在是太難。

學好高等數學、微積分也是掌握物理的前提之一

STEM 學生，尤其是基礎學科的流失率逐年提高，而與此同時，社會對他們的需求卻依舊很高，出現了不小的人才缺口。

因此，西維吉尼亞大學和加州理工大學的研究人員提出，用 AI 算法來拯救這些學生吧。

他們認為，用機器學習算法，來識別哪些學生有掛科風險。這樣教師就可以根據預測結果，有針對性地進行指導，從而提高學生的通過率，也能及時了解他們的掌握情況。

算法：參考過往表現，預測未來成績

1、樣本抽取

研究人員從來兩所大學的抽取了三個樣本，來訓練預測學生表現的人工智慧算法。

這些樣本數據包括了：學生的 ACT（美國高考）成績、大學 GPA 、物理課上收集的數據（比如課後作業成績和考試成績）。

其中，樣本一和樣本二來自於美國東部一所大學的物理科學和工程專業的學生。

樣本一：包括 2000 年至 2018 年，完成大學物理 1 課程的所有學生，樣本量為 7184 人。

樣本二：2016 年秋季至 2019 年春季學期的數據，樣本量為 1683 人。樣本包括了課堂表現數據，比如平均答題次數、課後作業平均成績、學期考試分數等。

樣本三：數據來自於 2017 年整個學年的力學入門課。樣本三收集於另一所大學，該大學位於美國西部。

2、變量

本研究中所使用的變量，都是來自大學和班級內部。同時，也將一些人口統計信息如性別、族裔等信息納入其中。

學生的高中成績、是否有微積分基礎等都是考慮的變量

3、隨機森林算法預測

研究中，採用隨機森林機器學習算法，來預測學生的入門物理學課程最終成績。算法最後會將學生分為獲得 A、B 或 C 的學生（歸為 ABC 類學生）和獲得 D、F 或 W 的學生（歸為 DFW 類潛在掛科學生）。

為了了解算法的性能，他們將數據集分為測試和訓練數據集。訓練數據集用於開發分類模型，以訓練分類器。

測試數據集則用於表征模型性能。

分類模型預測測試數據集中每個學生的測試結果後，會將預測結果與實際結果進行比較。

4、結果：尷尬了，準確度 57 %

經過模型調整與驗證，研究者得出了預測結果，但準確率實在不太樂觀……

模型在三個樣本集的表現

他們指出，在對整個樣本預測結果中，女性和少數民族學生較多的樣本，DFW 準確性較低，他們指出，這需要對人口統計學進行模型調整。

在第一個樣本上訓練的算法，預測「DFW 類學生」的準確性僅為 16％，研究人員分析，這可能是因為訓練集中，成績為 DFW 的學生比例很低（12％）所致。

樣本一中，模型的最佳表現準確度僅僅達到 57%，也就是僅比隨機機率好一點點而已。

5、結果準確率低，模型引爭議

面對這個結果，他們認為：對於教育工作者和正在努力學習的學生來說，此類機器學習分類模型，可能是一個強大的工具，可以更好指導教育干預和教育資源的分配。

研究人員：任何模型都不能達到 100％的準確度

網友：可是... 57% 是不是有點低？

但是，也有批評者認為，像這樣的技術，可能會帶有偏見或誤導性的預測，給學生造成傷害。

一直研究表明，即使接受了大型語料庫的訓練，人工智慧在預測複雜結果方面，仍會存在偏差問題。

此前，某企業的內部 AI 招聘工具，就因為表現出對女性的偏見，而被停用。

因此，人們也擔心，這種成績預測算法，不僅不能起到提高 STEM 學生保留率，反而會加劇不平等現象。

當然一切的結果都只是預測，考試嘛，三分天註定，七分靠打拚，剩下的九十分靠老師的心情。

對於這樣的做法，你覺得是否值得鼓勵？歡迎在留言區和我們討論！