5款AI大模型参加山东高考:豆包文科683分夺冠,Gemini理科655分居首
近日,5款主流大模型参与2025年山东高考全科测评,其中豆包Seed 1.6-Thinking以683分获文科第一,Gemini 2.5 Pro以655分摘得理科榜首,整体表现远超去年水平。测评显示,AI在语数英等基础学科已达顶尖考生水准,文综表现尤为突出,而理科受限于图像识别能力,但在图文结合测试中成绩大幅提升。此次评测未进行任何prompt优化,所有题目均为原始输入,体现出大模型在推理、多模态理解和长文本处理方面的显著进步。专家认为,随着AI应试能力逼近极限,未来更应关注其在真实世界复杂问题中的应用潜力。来源:https://mp.weixin.qq.com/s/W-akL4I5_2gm7oSloAZGbw
页:
[1]