陈天奇团队LLM结构化生成新引擎XGrammar:百倍加速、近零开销

[复制链接]
周大 发表于 2024-11-26 15:08:20 | 显示全部楼层 |阅读模式
陈天奇团队推出开源项目XGrammar,旨在解决大语言模型(LLM)在结构化数据生成中的效率问题。XGrammar通过字节级下推自动机和自适应token掩码缓存等技术,将上下文无关语法的每token延迟减少100倍,并在H100 GPU上将LLM serving速度提升80倍。评估结果显示,XGrammar在多种平台上的高效性和低开销,有望推动结构化生成在更多领域的应用。
来源:https://mp.weixin.qq.com/s/SvLrhl2pO-iPQdcCJCtmyg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-25 11:17 , Processed in 0.284141 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表