不靠海量数据,如何精准喂养大模型?上交Data Whisperer:免训练数据选择法,10%数据逼近全量效果

[复制链接]
周大 发表于 2025-7-29 15:31:14 | 显示全部楼层 |阅读模式
上海交通大学联合多所高校及企业提出 Data Whisperer,一种无需训练、基于注意力机制的数据选择方法,利用大模型自身上下文学习能力,自动筛选高质量训练样本。仅需 10% 数据即可达到接近全量数据的微调效果,在 GSM8K、DialogSum 等任务中表现优于现有方法。其引入的 STR 指标显示其选题效率显著更高。该方法通过 ICL 构建与注意力权重评估样本质量,支持小模型选题、大模型精调的弱选强训模式,适用于资源受限场景。理论分析表明,ICL 过程模拟了参数更新机制,为大模型训练提供新范式。
来源:https://mp.weixin.qq.com/s/cPRZoIKrhfpRFRk4exaxiQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 00:28 , Processed in 0.300001 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表