{中美AI“考生”东大入学考：英语超群数学短板-能否预示AI未来

2025-04-08 18:03:02 来源｜互联网

近期，据日经新闻披露的一项联合研究成果显示，中美两国的新型生成式人工智能（AI）已经展现出令人瞩目的学术能力，成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业DeepSeek的“R1”模型得出的。

测试内容涵盖了2025年度的东京大学入学考试科目，由AI初创公司Life Prompt提供答案输出，并由知名预备学校河合塾的专业讲师进行评分。结果显示，在两个基础模型的表现中，o1获得了374分，R1紧随其后，取得了369分，均超过了东大理科3类合格的最低分数线368.7分。

值得注意的是，尽管R1在理科1类和理科2类的共通考试中未能达到合格线，但在其他类别，包括文科在内，它与o1均成功“合格”。这一表现不仅展示了AI在跨学科应用上的潜力，也反映了其在学术评估中的广泛适用性。

{中美AI“考生”东大入学考

在具体的考试科目中，英语成为了AI模型的强项。o1和R1在英语部分的得分率均超过了75%，河合塾的英语讲师久恒秀雄对此评价道：“这两个模型在英语表达上几乎没有单词和语法的错误，其水平远远超过了东大考生的平均水平。”

然而，在数学科目上，尽管AI模型能够正确解答出不少最终答案，但在图形处理和论证问题上却频繁出现论述错误和说明不足的情况。在满分为120分的理科数学考试中，o1得了38分，R1得了49分，这一成绩显著低于合格者的平均分。负责数学评分的香坂季京讲师指出：“AI在数学论证上的表现还有待提高。”

对于这一研究成果，自2011年起便致力于“机器人能否进入东京大学”项目的国立信息学研究所新井纪子教授给予了高度评价：“这是AI成长历程中的一个重要里程碑。然而，我们也必须认识到，AI有时会给出令人困惑甚至错误的答案。因此，培养能够正确判断并熟练使用AI输出的人才显得尤为重要。”