谷歌版o1模型发布了,脚踢o1满血版,登顶榜单第一,速度起飞
谷歌DeepMind发布的Gemini 2.0 Flash Thinking模型在多项AI推理测试中超越OpenAI的O1系列。特别是在九年级数学题测试中,仅用7.3秒就答对7道题,而O1用时2分22秒仅答对5道。Gemini 2.0在梗图理解和微表情识别任务中也展现了更快的速度和可接受的准确率,尽管存在一些小瑕疵。然而,在数独和成语猜谜任务中,两者均未能给出正确答案。总体而言,Gemini 2.0作为推理模型展现出了显著优势,尤其是在处理速度方面。来源:https://mp.weixin.qq.com/s/zGGLOZmmwxvSeW6MbP09QQ
页:
[1]