华为诺亚方舟实验室推出DeepDiver,7B模型凭SIS媲美671B参数DeepSeek-R1

[复制链接]
周大 发表于 2025-6-5 13:43:47 | 显示全部楼层 |阅读模式
华为诺亚方舟实验室推出Pangu DeepDiver模型,借助Search Intensity Scaling技术,使7B参数规模的LLM在开域信息获取能力上媲美671B参数的DeepSeek-R1。研究通过WebPuzzle数据集训练模型,提升其在真实互联网环境中的检索与推理能力。DeepDiver采用Agentic RL训练方法,展现出动态调整搜索强度的能力,在多项基准测试中取得显著优势,验证了该方法的有效性与泛化能力。
来源:https://mp.weixin.qq.com/s/GbmyEqZC9NhKymqN5WatIQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-24 11:47 , Processed in 0.275887 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表