AI大模型“集体参加2024年高考”，成绩单揭晓，文科成绩优异，理科普遍欠佳

2024年全国高考结束后，国内外众多AI大模型随之上阵，在考场外参加了一场“高考”。6月24日，极客公园高考新课标Ⅰ卷全科目大模型评测报告出炉，成绩单让广大网友很感兴趣。

据了解，本次“大模型考生”包括GPT-4o（OpenAI）、豆包（字节跳动）、文心4.0（百度）、百小应（百川智能）、通义千问2.5（阿里巴巴）、Kimi智能助手（月之暗面）、元宝（腾讯）、智谱清言（智谱AI）以及海螺AI（MiniMax）等。使用的考卷，是覆盖地域广泛的“新课标Ⅰ卷”，与河南省考生所用的考卷相同。

从考试成绩来看，在文科方面，GPT-4o以562分位列榜首，国产大模型豆包表现优异，斩获542.5分的高分，成功超过河南文科一本线20多分。据悉，2024年河南文科本科一批录取分数线为521分，豆包、文心4.0、百小应三款国产AI大模型成功“冲上一本线”。
AI大模型“集体参加2024年高考”，成绩单揭晓，文科成绩优异，理科普遍欠佳
真实考题+名师阅卷文科表现出色，理科成绩欠佳

据了解，本次大模型“高考”，语文作文的阅卷人是北京市级骨干教师、怀柔区语文学科带头人夏老师。夏老师多次参与全国高考语文阅卷，经验颇为丰富。记者综合网络资料发现，在文科考试中，大模型们的表现普遍比较出色，特别是在语言类科目上，展现出了一定的逻辑与语言组织能力。然而在写作方面，尽管大模型的文章结构清晰、语言通顺，但普遍存在理性有余而感性不足的情况，缺乏感情色彩与感染力。

理科方面，大模型们的成绩则普遍欠佳，多数大模型的理科总分在400分以下，与河南理科511分的一本线存在差距。

理科普遍不及格，大模型更像文科生

资料显示，在由历史、地理、政治组成的新课标“文综”考卷评测中，GPT-4o获得237分，平均分79分，优于多数真实考生。

国产大模型产品中，豆包的文综成绩最高，为224.5分。历史科目最高分82.5分，豆包摘得；政治科目最高分88分，GPT-4o摘得；地理科目最高分68分，GPT-4o摘得。

理科考试中，9款大模型产品里，数学考试只有GPT-4o、文心一言4.0和豆包获得60分以上的成绩，但面对满分150分的试卷，均未及格。在重点考查实验探究能力的化学和物理试卷中，各模型的平均分分别只有34分（满分100分）和39分（满分110分）。

尽管在理科考试中，各家大模型都有可圈可点之处，例如“豆包”大模型在求导题目和三角函数题上表现较好，展现出了一定的解题能力，但整体而言，在本次“高考”中数理科目全线不及格，大模型的理科最好成绩还无法进入真实考生的前30%。如何让大模型“文理兼修”，像人类一样思考和解决问题，大模型或许还有很长的路要走。

国产AI技术能力显著进步，挑战依然巨大

从这次“高考”结果来看，大模型在文科领域展现出了一定的优势，尤其在语言处理和知识记忆方面表现突出。河南高考分数段统计数据显示，GPT-4o的562分在文科考生中排名8811名，相当于真实考生的前2.45%，国产大模型“豆包”位列约4.27%的位置。在过去一年多的时间里，国产AI技术能力取得了显著进步。

理科领域，面对需要深度逻辑推理和灵活应变的问题时，大模型仍面临巨大挑战。这表明大模型在处理某些特定类型的任务时具备较强能力，但在综合运用知识和解决复杂实际问题方面，与人类的智力水平仍存在差距。

此次通过“高考”检验各家大模型，不仅备受业界及广大网友关注，对于大模型的发展也意义重大。一方面，为评估大模型的学习和知识运用能力提供了全新、客观的标准。同时，也让我们更加清晰地看到了各家大模型的优势和不足。在接下来的一年中，各家大模型将如何进步与发展，值得持续追踪。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

AI大模型“集体参加2024年高考”，成绩单揭晓，文科成绩优异，理科普遍欠佳

最新文章

知名壁纸站 https://wallhaven.cc 宕机

win7/8/10/11/12 鼠标右键菜单在左边，怎么改回右边？

CentOS 7 结束了生命周期（EOL），切换yum源为CentOS 7续命

原创虚拟机的内存文件（通常以 .vmem 扩展名结尾）默认位置

2024年整理最新 win10/win11版本历史以及终止支持日期

Windows Server 版本历史小结

随便看看

BT宝塔/1panel面板1块硬盘被分成了两个区怎么办? 如何自定义Rocky Linux/ AlmaLinux OS 8.7以上系统安装分区？纯原创手打干货中英文对照图文教程 linux分区教程

#科普# 带你彻底了解 Hostdare这家VPS该怎么选：实时更新最新有效Hostdare促销优惠码（全部机型），CN2-GT,CN2-GIA vps主机

#BuyVM主机VPS优惠码# 如何将BuyVM的VPS由1Gbps带宽升级10Gbps不限流量？

BuyVM：卢森堡VPS#抢购攻略#+卢森堡/拉斯维加斯 ”Block Storage”存储块补货专用贴,抗投诉无视版权VPS

#BuyVM主机优惠码# 512MB小鸡补货! 需要赶快抢! 超低价自动备份+免费快照功能,支持DIY添加80TB额外NVME硬盘

AI大模型“集体参加2024年高考”，成绩单揭晓，文科成绩优异，理科普遍欠佳

相关文章

最新文章

随便看看

标签