来自香港中文大学与西湖大学的研究者提出 FDA——一种新型无数据模型融合框架,通过将任务知识编码为输入空间中的功能对偶锚点,实现在无需原始数据条件下高效整合多个专家模型。实验显示,FDA 在多任务性能上较传统任务向量方法提升近 18%(平均得分 87.26 vs 73.94),GLUE 分数提升 15.4%,并在 ViT 和 RoBERTa 等不同架构中展现良好通用性,为大规模模型融合提供了更灵活、鲁棒的新路径。
来源:https://mp.weixin.qq.com/s/KssulRec4pP5gXkZrZ4Kxg