大模型评测 Sora文生视频领先 K12学科测试显差距

[复制链接]
周大 发表于 2024-5-18 15:58:37 | 显示全部楼层 |阅读模式
北京智源研究院近日发布的大模型评测报告显示,国内头部语言模型在中文环境中的表现接近国际一流,但在K12学科测试中,模型的综合学科能力和理解图表能力不及人类学生。OpenAI Sora在文生视频能力上领先,但多模态模型的发展仍处初级阶段,未来评测需关注其对世界模型的理解和创作能力。王仲远强调,大模型K12测试旨在评测跨学科能力而非专门针对教育领域。
来源:https://tech.ifeng.com/c/8Zg4sQedHel

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-9 03:29 , Processed in 0.277149 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表