阿里清华联合提出D-MoLE框架:动态调整多模态大模型架构,助AI持续学习进化

[复制链接]
周大 发表于 2025-7-10 14:32:33 | 显示全部楼层 |阅读模式
清华大学与阿里巴巴联合团队提出新型持续多模态指令微调框架D-MoLE,成功解决多模态大模型在持续学习中的任务架构冲突与模态不均衡问题。研究成果已被ICML 2025收录,投稿录用率仅26.9%。实验显示,D-MoLE在多个任务上的平均性能较现有最佳方法提升约15%,并显著降低遗忘率。该方法已应用于阿里安全多模态审核系统,提升其在多平台、多规则环境下的适应效率与灵活性。
来源:https://mp.weixin.qq.com/s/0hgmqw1VkQxe_S8IpUDVrA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-24 03:55 , Processed in 0.286382 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表