小模型借助TTS策略超越大模型
多机构联合研究表明,使用计算最优TTS策略,小规模语言模型在特定任务上可超越大型模型。研究发现0.5B模型在数学任务上优于GPT-4o;3B模型超越405B模型;7B模型胜过o1和DeepSeek-R1。TTS通过分配额外算力增强LLM推理能力,成为提升性能的新范式。研究指出奖励感知计算最优TTS策略能适应不同模型、提示词和奖励函数,且TTS性能与PRM过程监督能力正相关。此外,小型模型通过该策略可在更少FLOPS下超越大型模型,总FLOPS减少100-1000倍。来源:https://mp.weixin.qq.com/s/ygv_CIcVJcRsgr98fdKc_g
页:
[1]