英伟达等研究人员发文称小语言模型是Agent未来,给出迁移六步法
英伟达与佐治亚理工学院研究人员提出,当前AI Agent普遍依赖超大规模语言模型(LLM)的做法并非最优,小语言模型(SLM)在多数场景下更高效、稳定且更具成本优势。论文指出,新一代SLM已在多项任务中表现优异,如Phi-2、SmolLM2等,其性能足以胜任Agent中的结构化、重复性任务。相比LLM,SLM延迟更低、能耗更少,更适合边缘部署与模块化系统设计。研究建议采用“默认用SLM、必要时调用LLM”的工程范式,并提供一套六步迁移路径,助力企业实现高效、低成本的智能体部署。来源:https://tech.ifeng.com/c/8lvHKJsUmDA
页:
[1]