o3斩获IOI金牌冲榜全球TOP 18,自学碾压顶尖程序员!48页技术报告公布
OpenAI的o3模型在IOI 2024竞赛中以394分(满分600)夺得金牌,跻身全球前18名。该模型通过强化学习和大规模计算资源训练,从“编程菜鸟”成长为顶尖选手,并在全球编程竞赛CodeForces中排名前200。研究团队发表48页论文,揭示o3自主发展出独特测试策略,如先编写暴力解法验证优化方案。实验表明,大规模强化学习比手工设计策略更有效,使o3在编程竞赛和实际软件开发任务中均表现优异,评分达2724(99.8百分位),接近顶尖人类选手水平。来源:https://mp.weixin.qq.com/s/NyGYfBCKd1QLa7qzAf9ZoA
页:
[1]