小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law

周大发表于 2024-9-11 14:47:44

谷歌DeepMind研究发现，在一定计算预算下，通过动态分配测试时计算资源的小模型性能超过大14倍的模型。研究提出“计算最优”扩展策略，根据不同prompt难度自适应分配资源，结果显示该策略在部分场景下更经济有效，引发网友热议，并猜测OpenAI新模型“草莓”可能采用类似方法。
来源：https://mp.weixin.qq.com/s/tfi7VOpSdKIXVb--k6NCSg

页: [1]

靠浦ai课堂's Archiver

小模型越级挑战14倍参数大模型，谷歌开启Test-Time端新的Scaling Law