谷歌DeepMind优化AI模型新思路,计算效率与推理能力兼得

[复制链接]
周大 发表于 2024-12-28 18:35:06 | 显示全部楼层 |阅读模式
谷歌DeepMind推出“可微缓存增强”新方法,在不增加计算负担的情况下显著提升大语言模型(LLM)推理性能。该方法通过训练协处理器增强LLM的键值缓存,使模型生成更丰富的输出。测试显示,在Gemma-2 2B模型上,GSM8K数据集准确率提高10.05%,MMLU性能提升4.70%,同时降低困惑度,为处理复杂任务提供新的解决方案。
来源:https://tech.ifeng.com/c/8ffyqXcl37U

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-2 15:25 , Processed in 0.261392 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表