大不同手游网:为互联网用户提供安全可靠的手机应用资源下载!

{中美AI“考生”东大入学考:英语超群数学短板-能否预示AI未来

2025-04-08 18:03:02 来源|互联网

近期,据日经新闻披露的一项联合研究成果显示,中美两国的新型生成式人工智能(AI)已经展现出令人瞩目的学术能力,成功跨越了日本顶尖学府——东京大学理科3类入学考试的门槛。这一突破性进展是通过对比测试美国OpenAI的“o1”模型与中国AI初创企业DeepSeek的“R1”模型得出的。

测试内容涵盖了2025年度的东京大学入学考试科目,由AI初创公司Life Prompt提供答案输出,并由知名预备学校河合塾的专业讲师进行评分。结果显示,在两个基础模型的表现中,o1获得了374分,R1紧随其后,取得了369分,均超过了东大理科3类合格的最低分数线368.7分。

值得注意的是,尽管R1在理科1类和理科2类的共通考试中未能达到合格线,但在其他类别,包括文科在内,它与o1均成功“合格”。这一表现不仅展示了AI在跨学科应用上的潜力,也反映了其在学术评估中的广泛适用性。

{中美AI“考生”东大入学考

在具体的考试科目中,英语成为了AI模型的强项。o1和R1在英语部分的得分率均超过了75%,河合塾的英语讲师久恒秀雄对此评价道:“这两个模型在英语表达上几乎没有单词和语法的错误,其水平远远超过了东大考生的平均水平。”

然而,在数学科目上,尽管AI模型能够正确解答出不少最终答案,但在图形处理和论证问题上却频繁出现论述错误和说明不足的情况。在满分为120分的理科数学考试中,o1得了38分,R1得了49分,这一成绩显著低于合格者的平均分。负责数学评分的香坂季京讲师指出:“AI在数学论证上的表现还有待提高。”

对于这一研究成果,自2011年起便致力于“机器人能否进入东京大学”项目的国立信息学研究所新井纪子教授给予了高度评价:“这是AI成长历程中的一个重要里程碑。然而,我们也必须认识到,AI有时会给出令人困惑甚至错误的答案。因此,培养能够正确判断并熟练使用AI输出的人才显得尤为重要。”

最新
更多

51吃瓜群众-51吃瓜群众完整版v2.1.5

随着互联网的不断发展,各种平台和应用逐渐渗透到我们的生活中,满足了用户的多样需求。其中,“51吃瓜群众完整版”作为一款广受关注的娱乐类应用,吸引了大量年轻用户的关注。无论是在

请记住新域名紧急通知-请记住新域名紧急通知免费播放国语版v2.3.4

在当今信息爆炸的时代,很多网站和服务都在不断地调整和优化,为用户提供更便捷的使用体验。而对于广大用户而言,掌握并记住新域名是避免不必要麻烦的关键。今天,我们特别提醒大家:请记住新域名紧急通知-请记住新

试看10分钟保湿-试看10分钟保湿免费观看最新版v7.9.8

在现代快节奏的生活中,许多人总是难以找到时间进行深层的皮肤护理。而“试看10分钟保湿免费观看最新版”正是应对这一需求的创新产品。它通过精准的保湿配方和短暂的使用时间,让用

农夫新航道全集免费观看-农夫新航道全集免费观看在线播放完整版v2.0.9

随着网络视频平台的普及,用户对各种高清内容的需求不断攀升。而《农夫新航道全集免费观看在线播放完整版》作为一款广受欢迎的影视资源,不仅能满足观众对精彩剧集的渴望,更凭

45分钟一清二楚看大片-45分钟一清二楚看大片免费观看最新版v8.6.4

随着网络视频的普及,越来越多的人开始通过各类视频平台观看自己喜欢的影片。而在众多的选择中,45分钟一清二楚看大片免费观看最新版脱颖而出,成为用户热衷的选择之一。这款

xbox免费看电影-xbox免费看电影在线精品版v11.6.3

随着数字娱乐的普及,越来越多的用户倾向于通过各种设备进行流媒体观看。作为游戏主机的领导者,Xbox不仅为玩家提供了丰富的游戏体验,还在影音娱乐方面展现了强大的潜力。特别是“xbox免费看电影-xbox

本站所有软件来自互联网,版权归原著所有。联系方式:anptzw@163.com 网站地图

Copyright©2025 大不同手游网  All Rights Reserved 备案号:粤ICP备2021027678号-1