周大 发表于 2024-9-3 15:05:33

英伟达推全新视觉语音模型NVEagle,可以看图聊天

英伟达联手学术界推出视觉语言模型NVEagle,具备理解复杂场景的能力,并提供三种版本满足不同需求。13B-Chat版专为对话式AI优化。该模型采用混合专家机制,可动态选择最佳视觉编码器,显著提升处理复杂视觉信息的能力,现已在Hugging Face上发布。
来源:https://tech.ifeng.com/c/8cY6gAewvak
页: [1]
查看完整版本: 英伟达推全新视觉语音模型NVEagle,可以看图聊天