中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
中国科学技术大学MIRA实验室提出了KG-SFT框架,通过知识图谱驱动的监督微调,提升大语言模型在特定领域的知识理解和推理能力。实验表明,该框架在多个领域和语言的数据集上表现出色,特别是在低数据医学问答任务中,仅用5%训练数据就使准确率提高了近14%。KG-SFT由Extractor、Generator和Detector三个组件构成,能够生成高质量解释,增强模型性能,且可作为插件式模块与现有方法结合使用。来源:https://mp.weixin.qq.com/s/z6B6neRA90_DBFESZYyJzQ
页:
[1]