Grok 4实测出炉:8项测试胜o3,能写游戏能教学,却也数不清6根手指
马斯克发布xAI团队最新大模型Grok 4,宣称其在所有学科上达到博士后水平,并有望年内实现科学发现。尽管价格高昂,仍吸引大量用户付费体验。博主测试显示,在物理模拟、越狱攻击、逻辑推理等8项任务中,Grok 4全面击败OpenAI的o3,后者仅获2项胜利。该模型还能快速生成Flappy Bird等小游戏,并实现数学公式的可视化,展现其在教育和编程领域的潜力。然而,也有用户报告其在识别手指数量、绘制地图等任务中出现明显错误,且API缺乏推理过程输出。尽管表现亮眼,马斯克本人仍表示“仍有改进空间”,网友则调侃其成功背后是强大的算力和高强度开发。来源:https://tech.ifeng.com/c/8ks9Yt57wc9
页:
[1]