微软推出其首款自研AI模型:MAI-Voice-1 秒级生成音频
微软发布首款自研AI模型MAI-Voice-1与MAI-1-preview,其中语音模型可在1秒内生成1分钟音频,已用于新闻播报与播客生成;通用模型训练使用约1.5万块H100 GPU,将逐步应用于Copilot文本场景。用户可在Copilot Labs自定义语音内容,MAI-1-preview已在LMArena开放测试。微软强调聚焦消费者体验优化,未来将整合多种专业模型以释放更大价值。来源:https://tech.ifeng.com/c/8mCopK8tSil
页:
[1]