周大 发表于 2025-7-10 14:32:33

阿里清华联合提出D-MoLE框架:动态调整多模态大模型架构,助AI持续学习进化

清华大学与阿里巴巴联合团队提出新型持续多模态指令微调框架D-MoLE,成功解决多模态大模型在持续学习中的任务架构冲突与模态不均衡问题。研究成果已被ICML 2025收录,投稿录用率仅26.9%。实验显示,D-MoLE在多个任务上的平均性能较现有最佳方法提升约15%,并显著降低遗忘率。该方法已应用于阿里安全多模态审核系统,提升其在多平台、多规则环境下的适应效率与灵活性。
来源:https://mp.weixin.qq.com/s/0hgmqw1VkQxe_S8IpUDVrA
页: [1]
查看完整版本: 阿里清华联合提出D-MoLE框架:动态调整多模态大模型架构,助AI持续学习进化