AI 扩展范式推动技术革新:从下一词预测到思维链强化学习

[复制链接]
周大 发表于 2025-1-4 15:32:25 | 显示全部楼层 |阅读模式
OpenAI 研究科学家 Jason Wei 在宾夕法尼亚大学的演讲中探讨了大型语言模型(LLM)的扩展范式。他指出,扩展是通过增加模型规模、数据量和计算资源来持续改进 AI 能力的关键引擎。扩展经历了从单一的下一词预测到基于思维链的强化学习的转变,前者让模型学会多种能力,后者则增强了复杂任务的推理能力。他还提到,AI 研究文化正从优化算法转向优化数据质量,并强调未来 AI 将在科学、医疗、多模态和工具使用方面有更大发展空间。Jason Wei 用“just keep scaling”表达了对扩展策略的信心。
来源:https://mp.weixin.qq.com/s/3d2eE_uAPWOY289MCLn09A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 03:31 , Processed in 0.296476 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表