FDA对偶锚点:模型知识迁移的新视角——从参数空间到输入空间

[复制链接]
周大 发表于 2025-11-14 13:43:12 | 显示全部楼层 |阅读模式
来自香港中文大学与西湖大学的研究者提出 FDA——一种新型无数据模型融合框架,通过将任务知识编码为输入空间中的功能对偶锚点,实现在无需原始数据条件下高效整合多个专家模型。实验显示,FDA 在多任务性能上较传统任务向量方法提升近 18%(平均得分 87.26 vs 73.94),GLUE 分数提升 15.4%,并在 ViT 和 RoBERTa 等不同架构中展现良好通用性,为大规模模型融合提供了更灵活、鲁棒的新路径。
来源:https://mp.weixin.qq.com/s/KssulRec4pP5gXkZrZ4Kxg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-28 03:05 , Processed in 0.256562 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表