小模型借助TTS策略超越大模型

周大发表于 2025-2-12 14:53:48

多机构联合研究表明，使用计算最优TTS策略，小规模语言模型在特定任务上可超越大型模型。研究发现0.5B模型在数学任务上优于GPT-4o；3B模型超越405B模型；7B模型胜过o1和DeepSeek-R1。TTS通过分配额外算力增强LLM推理能力，成为提升性能的新范式。研究指出奖励感知计算最优TTS策略能适应不同模型、提示词和奖励函数，且TTS性能与PRM过程监督能力正相关。此外，小型模型通过该策略可在更少FLOPS下超越大型模型，总FLOPS减少100-1000倍。
来源：https://mp.weixin.qq.com/s/ygv_CIcVJcRsgr98fdKc_g

		自动登录	找回密码
密码			立即注册

课程导航

小模型借助TTS策略超越大模型