大模型“取长补短”新思路入选NeurIPS'24,显著优于现有路由方法,南科大港科大出品

[复制链接]
周大 发表于 2024-11-15 14:44:43 | 显示全部楼层 |阅读模式
RouterDC是一种基于双重对比学习的路由架构,旨在高效组合多个大模型以“取长补短”。该方法被NeurIPS 2024接收,具有参数和计算高效性。实验显示,RouterDC在语言理解、代码生成和数学推理等任务中,分布内和分布外设定下的表现均优于现有方法,分别提升3.98%和1.90%的准确率。此外,RouterDC还具有成本高效性,比现有方法更经济。
来源:https://mp.weixin.qq.com/s/mvH42vpLwXBz0ClES3rCvA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-27 01:35 , Processed in 0.272855 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表