周大 发表于 2024-9-12 15:10:53

Scaling Law陷入困局,强化学习才是全村的希望?

AI领域预训练Scaling Law遭遇瓶颈,强化学习被视为突破方向。Claude Sonnet 3.5和DeepSeek通过RL在代码和推理能力上取得进展。OpenAI将发布草莓模型,性能优于GPT-4o但响应慢。ChatGPT Pro订阅计划上线,定价200美元/月。
来源:https://www.huxiu.com/article/3459333.html
页: [1]
查看完整版本: Scaling Law陷入困局,强化学习才是全村的希望?