周大 发表于 2025-5-25 15:13:55

AI领域聚焦推理优化与后训练策略

随着预训练阶段的边际效益递减,AI领域自2024年起聚焦于“Scaling What”新范式的探索。研究者提出了TTS(Test-Time Scaling)方法,通过在推理阶段增加计算资源提升模型性能,并将其应用范围从特定领域扩展至通用任务。香港城市大学等高校进一步提出“四轴分类框架”,将推理优化技术系统化,揭示了研究重点从预训练转向推理优化的趋势。同时,四种主要的Scaling策略——Parallel、Sequential、Hybrid和Internal,分别通过不同的方式优化模型性能。此外,微调与推理在后训练阶段被赋予同等重要性,凸显了高质量数据对模型行为的关键作用。
来源:https://mp.weixin.qq.com/s/eY7fAaqcs6NJX4eXqm4oMg
页: [1]
查看完整版本: AI领域聚焦推理优化与后训练策略