周大 发表于 2024-8-13 15:19:56

Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人

TII技术创新研究所开源了Falcon Mamba 7B,这是全球首个基于Mamba架构的通用大型模型,采用SSLM架构,克服了Transformer架构在处理长文本时的限制。该模型在多项测试中表现出色,超越了同级别模型Llama 3.1 8B和Mistral 7B。Falcon Mamba 7B能够在单张A10 24GB GPU上高效运行,处理任意长度的序列,展示了SSLM架构在大规模序列处理方面的显著优势。
来源:https://mp.weixin.qq.com/s/7Ojw4QJved6UmJ0PHRU2xg
页: [1]
查看完整版本: Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人