AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B

[复制链接]
周大 发表于 2025-3-6 15:09:43 | 显示全部楼层 |阅读模式
AMD宣布开源Radeon RX 9070系列Linux驱动程序,并推出Instella——一个3B参数的开源语言模型。该模型基于AMD Instinct MI300X GPU训练而成,性能可比肩Llama 3.2 3B、Gemma-2 2B等模型。AMD承诺Instella完全开源,提供模型权重、训练超参数、数据集及代码,旨在促进AI社区内的创新与合作。
来源:https://tech.ifeng.com/c/8hVBSvwaMAP

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 02:17 , Processed in 0.275952 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表