阿里开源MaskSearch框架:小模型通过检索增强预训练媲美大模型,开放域问答性能显著提升
阿里通义实验室推出开源框架MaskSearch,通过检索增强型掩码预测任务(RAMP)提升大模型的搜索与推理能力。该框架支持监督微调和强化学习两种训练方式,并引入课程学习策略优化性能。实验显示,MaskSearch在多领域问答任务中显著超越基线方法,小模型表现可媲美大模型,强化学习表现出更高性能潜力,为大模型智能体推理能力的发展提供了新方向。来源:https://mp.weixin.qq.com/s/rPtbRWgG8KhisPu-UkxSkQ
页:
[1]