腾讯发布一念LLM:大模型推理引擎,降低成本,支持国产硬件

[复制链接]
周大 发表于 2024-5-24 17:48:27 | 显示全部楼层 |阅读模式
腾讯推出一念LLM,一款创新的高性能大语言模型推理引擎,能有效降低推理成本,支持Nvidia和华为硬件,解决行业对国外GPU的依赖。一念LLM通过优化技术,如显存管理和调度,提升了推理效率,较其它开源框架推理成本下降20%+,在特定业务场景下,成本节省可达60%+。并已开源共享,助力学术和技术进步。
来源:https://mp.weixin.qq.com/s/rlyJwaOfDfNYMZEH7kfKGA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-8 13:25 , Processed in 0.289992 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表