小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

[复制链接]
周大 发表于 2024-9-11 14:47:44 | 显示全部楼层 |阅读模式
谷歌DeepMind研究发现,在一定计算预算下,通过动态分配测试时计算资源的小模型性能超过大14倍的模型。研究提出“计算最优”扩展策略,根据不同prompt难度自适应分配资源,结果显示该策略在部分场景下更经济有效,引发网友热议,并猜测OpenAI新模型“草莓”可能采用类似方法。
来源:https://mp.weixin.qq.com/s/tfi7VOpSdKIXVb--k6NCSg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 14:50 , Processed in 0.272753 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表