Grok 4实测出炉：8项测试胜o3，能写游戏能教学，却也数不清6根手指

周大发表于 2025-7-12 14:01:32

马斯克发布xAI团队最新大模型Grok 4，宣称其在所有学科上达到博士后水平，并有望年内实现科学发现。尽管价格高昂，仍吸引大量用户付费体验。博主测试显示，在物理模拟、越狱攻击、逻辑推理等8项任务中，Grok 4全面击败OpenAI的o3，后者仅获2项胜利。该模型还能快速生成Flappy Bird等小游戏，并实现数学公式的可视化，展现其在教育和编程领域的潜力。然而，也有用户报告其在识别手指数量、绘制地图等任务中出现明显错误，且API缺乏推理过程输出。尽管表现亮眼，马斯克本人仍表示“仍有改进空间”，网友则调侃其成功背后是强大的算力和高强度开发。
来源：https://tech.ifeng.com/c/8ks9Yt57wc9

页: [1]

靠浦ai课堂's Archiver

Grok 4实测出炉：8项测试胜o3，能写游戏能教学，却也数不清6根手指