谷歌Gemini 2.5 Flash混合推理模型发布

周大发表于 2025-4-18 15:24:08

谷歌推出首款混合推理模型Gemini 2.5 Flash，引入创新“思考预算”机制，可根据任务需求灵活调整推理深度。关闭思考模式下成本降低600%，性能媲美Gemini 2.0 Flash。该模型在多项基准测试中刷新记录，尤其在GPQA知识问答和代码任务中表现优异，超越Claude 3.7并接近o4-mini水平。网友实测证明其物理模拟及复杂任务处理能力出色。此外，开发者可通过API或控制台滑块设定Token预算，实现质量、成本与延迟的最佳平衡。
来源：https://mp.weixin.qq.com/s/Tx6dbqKwPTx9dqAW1xzT3w

页: [1]

靠浦ai课堂's Archiver

谷歌Gemini 2.5 Flash混合推理模型发布