Grok 4实测出炉:8项测试胜o3,能写游戏能教学,却也数不清6根手指

[复制链接]
周大 发表于 2025-7-12 14:01:32 | 显示全部楼层 |阅读模式
马斯克发布xAI团队最新大模型Grok 4,宣称其在所有学科上达到博士后水平,并有望年内实现科学发现。尽管价格高昂,仍吸引大量用户付费体验。博主测试显示,在物理模拟、越狱攻击、逻辑推理等8项任务中,Grok 4全面击败OpenAI的o3,后者仅获2项胜利。该模型还能快速生成Flappy Bird等小游戏,并实现数学公式的可视化,展现其在教育和编程领域的潜力。然而,也有用户报告其在识别手指数量、绘制地图等任务中出现明显错误,且API缺乏推理过程输出。尽管表现亮眼,马斯克本人仍表示“仍有改进空间”,网友则调侃其成功背后是强大的算力和高强度开发。
来源:https://tech.ifeng.com/c/8ks9Yt57wc9

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 23:34 , Processed in 0.282836 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表