Scaling Law陷入困局，强化学习才是全村的希望？

周大发表于 2024-9-12 15:10:53

AI领域预训练Scaling Law遭遇瓶颈，强化学习被视为突破方向。Claude Sonnet 3.5和DeepSeek通过RL在代码和推理能力上取得进展。OpenAI将发布草莓模型，性能优于GPT-4o但响应慢。ChatGPT Pro订阅计划上线，定价200美元/月。
来源：https://www.huxiu.com/article/3459333.html

页: [1]

靠浦ai课堂's Archiver

Scaling Law陷入困局，强化学习才是全村的希望？