周大 发表于 2025-3-6 15:09:43

AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B

AMD宣布开源Radeon RX 9070系列Linux驱动程序,并推出Instella——一个3B参数的开源语言模型。该模型基于AMD Instinct MI300X GPU训练而成,性能可比肩Llama 3.2 3B、Gemma-2 2B等模型。AMD承诺Instella完全开源,提供模型权重、训练超参数、数据集及代码,旨在促进AI社区内的创新与合作。
来源:https://tech.ifeng.com/c/8hVBSvwaMAP
页: [1]
查看完整版本: AMD推出完全开源的3B参数语言模型Instella,媲美Llama-3.2-3B和Qwen2.5-3B