昨日,在高考語文結束後,作文題目就一直霸榜微博熱搜。很多畢業多年的學子都在感慨,寫作文不僅要多看紅樓夢,還要懂點圍棋知識。
早在一周之前,一名哔哩哔哩up主@圖靈的貓就發布了視頻,稱自己用AI模型預測了2022年高考作文的題目。據這位up本人透露,自身是一名AI系統的資深算法專家,其團隊制作的爬蟲通過抓取一年内各類媒體上的信息,建立了一套AI系統,才預測出了今年高考作文最可能出現的命題方向。
AI押題本質上與人類無異,也是憑經驗
在6月1日發布的2022年高考作文題AI預測結果公布視頻中,該up主介紹了這一套AI系統實現的技術原理:高考作文看似是考試,其實是價值觀、人生觀和家國意識的引導,這個規則決定着一篇高考作文的得分高低。所以,高考的本質是思政任務,反映了國家意志,這也正是預測高考作文的根本原理。
而深谙此道的命題組,也會從近一年的國際事件、國家政策、會議文件、指導意見和官方報告中,篩選出一批重要度高、範圍較小的主題,并最終選出之前高考沒有出現過的,且最适合今年任務的高考作文題。而 AI 作為最擅長從大規模數據中挖掘規律的重要工具,其獲取的數據越多,分布越合理,也就能夠更加準确地預測到最終的結果。
基于以上思考,up主及其團隊專門寫了一套爬蟲。這套爬蟲抓取了一年内人民日報、人民網、央視新聞等官媒發表的文章、期刊、報紙以及高層會議的重要文件。然後再通過自然語言處理中的預訓練模型和主題建模算法,建立了一套可以理解中文新聞與文章的 AI 系統,并讓 AI 系統學習了過去幾年的高考作文出題思路,最終預測出了 2022 年高考中最可能出現的 7 個命題方向。
以 " 困難與希望 " 為例,在預測結果中,AI 系統主要基于模型表征提煉出預測主題和核心詞,而在學生理解命題的過程中,預測主題可以作為作文主要的寫作内容理解方向,模型表征提供的介紹可以作為案例引用植入文章中。而最上面的 " 困難、希望 " 核心詞,則可以作為作文标題的主要命題參考方向。
既然高考語文已經結束,那AI預測的準确性到底如何呢?
該up主設計的AI模型預測出的七大命題方向,分别是:困難與希望、拼搏與自強、探索與夢想、創新與發展、奮鬥與價值、公平與德育、美與環境。而在今年全國新高考 II 卷中,要求以 " 選擇 • 創造 • 未來 " 為主題開展寫作,同時提及了 " 科學家、科學攻關、北鬥導航系統 " 以及 " 新方法、新思維、新知識 " 等詞。在 AI 系統給出的以 " 探索、夢想 " 為主題的命題方向中,北鬥、芯片等科技名詞是模型表征,主題方向與高考作文命題也有所接近。
總體而言,在今年的高考中,AI 共“押中”了四道作文主題,但up主也客觀地指出," 今年各地高考作文結合熱點進行命題較多,這才讓 AI 系統押對了 4 個命題,但往年的題目一般不會直接從熱點進行出題,而是側面描寫和以小見大,這次命中較多也很特殊。"
“押中”題目事小,能寫高分作文更厲害
對于高考作文這類長文本寫作來說,不僅要求邏輯連貫、主題清晰,還需具備較高的可讀性、創造性。近年來,用AI模型來生成高考作文的嘗試已經進行了多次,今年也不例外,但寫作水平更多是讓人啼笑皆非的“零分作文”。
以昨天網絡上熱議的全國新高考I卷作文“本手、妙手、俗手”為例,AI生成作文的部分内容如下:
“本手、妙手、俗手”都屬于“手”,同理,抄手也屬于手。四川著名抄手,到底怎麼做呢?小編也很好奇。一般來說需要自己準備抄手皮和豬肉,按照教程包成抄手。煮熟後加芝麻紅油,撒上蔥末即可食用。好吃的紅油抄手就是這樣做成的,不說了,小編去試試了。
而在北京卷“像一道閃電”的命題微寫作中,AI更是給出了“或或或或或或或或,也嚯嚯不走自家的閃電接口”這種仿寫周傑倫歌曲的句子。
顯然,上面的AI模型并沒有真正理解題目的含義,隻是對數據進行了粗淺的處理而已。但在這些“零分作文”以外,昨天還有“數字人考生”親自參與了高考的作文寫作。
由百度推出的數字人度曉曉,也作答了全國新高考Ⅰ卷題為《本手、妙手、俗手》的議論文,引發全網刷屏,曾擔任北京高考語文閱卷組組長的申怡老師認為該篇作文“緊扣主題、立意明确,結構完整、語言流暢,而且還善于引經據典、使用修辭手法”,更是給出了48分的成績。據介紹,根據曆年情況,獲得48分及以上作文成績的考生,僅占不到25%,也就是說,數字人度曉曉的作文分數已趕超約75%的高考考生。
(大家覺得水平咋樣?)
除了作文輸出的質量高之外,數字人的作文輸出效率也很可觀。據悉,數字人度曉曉隻花費40秒就能根據作文題目創作出40多篇文章,其中的主要原因是獲得了百度文心大模型的加持。這個由百度最新推出的ERNIE 3.0 Zeus千億大模型,通俗點講,就像是一個見多識廣的“尖子生”、“學霸”,能夠理解給定的作文題目,再選擇符合立意的論據,從開篇引入到結尾扣題,結構完整并做到始終不跑題。此外,百度文心大模型還融合學習了大規模知識和海量數據,可以實現在“博覽群書”後廣泛自如地“引經據典”, 輸出優質作文内容。
何時才能交出滿分答卷
在高考作文之外,AI還曾多次參與過高考數學的答題。2017年時,人工智能機器人“準星AI-MATHS”首次公開挑戰高考數學,通過對當年的北京文科數學卷和文科全國數學卷Ⅱ進行作答,在完全掐斷題庫、斷網、無人幹涉、僅有12台服務器的情況下,分别用時22分鐘和10分鐘,就獲得了105分和100分的成績。
這個成績顯然已經非常出色,在分析丢分原因時,發現是因為模型不理解應用題的題目含義,本質上還是對于文本的理解出了問題。在人工智能領域,NLP一直被稱為是“掌上明珠”,雖然機器視覺早已取得了巨大進步,效果遠超人類,但文本相關的各類任務,AI與人類的表現差距依然很大。
因此,想要讓人工智能在高考中取得狀元級别的分數,在對知識的持續積累之外,重點還是要看與語義理解相關的NLP技術發展到了什麼階段。當然,AI領域技術的叠代更新速度是非常快的,進一步斬獲高分或許就是幾年内的事情。
不過,對于AI持續挑戰高考這件事,最終取得高分隻是其次,更大的意義在于将AI的解題能力進行規模化複制和推廣,既可以用于輔助教學和批改,也可以将這種能力遷移到其他的考試中去,甚至通過現在大火的“可解釋性AI”來啟發學生的思維,讓學生告别低效的題海戰術,真正掌握學習的方法。
參考資料:
1.《2022高考零分作文大賞,AI寫的讓我在紅樓夢裡笑成一道閃電》,果殼
2.《AI 押中 4 套高考作文題:科學、玄學還是炒作?》,新浪科技
3.《百度AI數字人度曉曉應戰高考作文:40秒寫40篇,水平超75%考生》,百度
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!