小模型借助TTS策略超越大模型

[复制链接]
周大 发表于 2025-2-12 14:53:48 | 显示全部楼层 |阅读模式
多机构联合研究表明,使用计算最优TTS策略,小规模语言模型在特定任务上可超越大型模型。研究发现0.5B模型在数学任务上优于GPT-4o;3B模型超越405B模型;7B模型胜过o1和DeepSeek-R1。TTS通过分配额外算力增强LLM推理能力,成为提升性能的新范式。研究指出奖励感知计算最优TTS策略能适应不同模型、提示词和奖励函数,且TTS性能与PRM过程监督能力正相关。此外,小型模型通过该策略可在更少FLOPS下超越大型模型,总FLOPS减少100-1000倍。
来源:https://mp.weixin.qq.com/s/ygv_CIcVJcRsgr98fdKc_g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 19:01 , Processed in 0.305077 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表