周大 发表于 2025-6-2 15:11:14

无需人工标注!AI自生成训练数据,靠「演绎-归纳-溯因」解锁推理能力

新加坡国立大学等机构提出“元能力对齐”训练框架,通过模仿人类推理心理学原理,将演绎、归纳与溯因能力融入模型训练。实验表明,该方法显著提升模型在数学与编程任务上的性能,跨领域表现优异。7B和32B规模模型在未见过的基准测试中准确率提高超10%,且性能随参数量增加而优化,为构建可解释且鲁棒的推理模型提供了新路径。
来源:https://mp.weixin.qq.com/s/rPbgjZvTQGeLGYYKaGXkPQ
页: [1]
查看完整版本: 无需人工标注!AI自生成训练数据,靠「演绎-归纳-溯因」解锁推理能力