谷歌Gemini 2.5 Flash混合推理模型发布
谷歌推出首款混合推理模型Gemini 2.5 Flash,引入创新“思考预算”机制,可根据任务需求灵活调整推理深度。关闭思考模式下成本降低600%,性能媲美Gemini 2.0 Flash。该模型在多项基准测试中刷新记录,尤其在GPQA知识问答和代码任务中表现优异,超越Claude 3.7并接近o4-mini水平。网友实测证明其物理模拟及复杂任务处理能力出色。此外,开发者可通过API或控制台滑块设定Token预算,实现质量、成本与延迟的最佳平衡。来源:https://mp.weixin.qq.com/s/Tx6dbqKwPTx9dqAW1xzT3w
页:
[1]