大模型“取长补短”新思路入选NeurIPS'24,显著优于现有路由方法,南科大港科大出品
RouterDC是一种基于双重对比学习的路由架构,旨在高效组合多个大模型以“取长补短”。该方法被NeurIPS 2024接收,具有参数和计算高效性。实验显示,RouterDC在语言理解、代码生成和数学推理等任务中,分布内和分布外设定下的表现均优于现有方法,分别提升3.98%和1.90%的准确率。此外,RouterDC还具有成本高效性,比现有方法更经济。来源:https://mp.weixin.qq.com/s/mvH42vpLwXBz0ClES3rCvA
页:
[1]