周大 发表于 2024-9-11 14:47:44

小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

谷歌DeepMind研究发现,在一定计算预算下,通过动态分配测试时计算资源的小模型性能超过大14倍的模型。研究提出“计算最优”扩展策略,根据不同prompt难度自适应分配资源,结果显示该策略在部分场景下更经济有效,引发网友热议,并猜测OpenAI新模型“草莓”可能采用类似方法。
来源:https://mp.weixin.qq.com/s/tfi7VOpSdKIXVb--k6NCSg
页: [1]
查看完整版本: 小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law