为这一个Tab键，我愿意单独付费：Cursor用在线强化学习优化代码建议，护城河有了？

周大发表于 2025-9-14 14:38:54

Cursor 推出基于在线强化学习的新版 Tab 模型，通过实时收集用户对代码建议的接受或拒绝行为，持续优化推荐策略。新模型建议数量减少21%，接受率提升28%，并采用每1.5-2小时高频部署的方式，构建了与传统模型开发流程截然不同的实时反馈机制。该技术获得AI社区广泛认可，并被认为是AI开发模式的重要演进方向。Cursor 采用策略梯度方法，通过奖励函数引导模型判断建议时机，而非单纯依赖事后过滤，标志着AI辅助编程进入新阶段。
来源：https://mp.weixin.qq.com/s/ShalRibfp9YSE5UFS0GLVg

页: [1]

靠浦ai课堂's Archiver

为这一个Tab键，我愿意单独付费：Cursor用在线强化学习优化代码建议，护城河有了？