DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升

[复制链接]
周大 发表于 2025-2-17 14:54:43 | 显示全部楼层 |阅读模式
DeepSeek团队构建了包含300多万个实例的数据集CODEI/O,通过将代码转化为思考过程来训练大模型。经过CODEI/O训练后,Qwen、Llama等模型在常识、数学、物理等多个领域推理能力显著提升,特别是在非代码类任务上也展现出良好迁移能力。研究团队通过对代码文件预处理、生成输入-输出对、合成自然语言思维链等步骤完成数据集构建,并引入验证和修订机制优化数据质量。测试结果显示,CODEI/O相比其他数据集效果更佳且通用性更强。
来源:https://mp.weixin.qq.com/s/2Xb8hdrZe0JcLjBdKfktkQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-17 15:34 , Processed in 0.309148 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表