Case2Code:合成数据助力大模型归纳推理飞跃
复旦大学发起的Case2Code项目通过合成数据训练,显著提升了大模型在代码领域的归纳推理能力。使用1.3M合成数据集,7B小模型在评估集上的准确率提升高达18.9%,甚至超越LLaMA3-70B和GPT-3.5,接近GPT-4水平。实验展示了Case2Code合成数据的有效性和泛化能力,能显著提升大规模模型的归纳推理和整体编码能力。来源:https://mp.weixin.qq.com/s/ndc4a8uKTlvJgUWtPkKXgg
页:
[1]