周大 发表于 2024-5-18 15:58:37

大模型评测 Sora文生视频领先 K12学科测试显差距

北京智源研究院近日发布的大模型评测报告显示,国内头部语言模型在中文环境中的表现接近国际一流,但在K12学科测试中,模型的综合学科能力和理解图表能力不及人类学生。OpenAI Sora在文生视频能力上领先,但多模态模型的发展仍处初级阶段,未来评测需关注其对世界模型的理解和创作能力。王仲远强调,大模型K12测试旨在评测跨学科能力而非专门针对教育领域。
来源:https://tech.ifeng.com/c/8Zg4sQedHel
页: [1]
查看完整版本: 大模型评测 Sora文生视频领先 K12学科测试显差距