周大 发表于 2025-5-19 13:31:20

北大DeepSeek联合发布NSA技术革新长文本处理

北大与DeepSeek合作的NSA论文在ACL 2025中获得4.5分高评,有望冲击最佳论文奖。NSA技术通过革新传统注意力机制,大幅提升长文本处理效率,速度最高提升11倍。此外,张铭教授团队在高效后训练、金融多模态评估、数学推理增强及交通流量预测等多个领域取得突破性成果,多篇论文入选ICML、AAAI等顶级会议,展现其在AI领域的深厚研究实力和广泛影响力。
来源:https://mp.weixin.qq.com/s/GHg4rjtq83bw5W5-HM3I7w
页: [1]
查看完整版本: 北大DeepSeek联合发布NSA技术革新长文本处理