周大 发表于 2024-9-3 15:26:33

专用于理解游戏场景的开源大模型-VideoGameBunny

加拿大研究人员开源了VGB大模型,旨在解决游戏场景理解与图像识别问题。VGB作为视觉AI助理,可帮助玩家掌握技巧,同时协助开发者识别并修复游戏中的bug。该模型基于Bunny模型开发,支持高分辨率图像处理,并结合了LLama-3-8B语言模型及SigLIP视觉编码器,训练数据涵盖413款游戏中的185,000多张图像。
来源:https://www.chinaz.com/2024/0903/1639860.shtml
页: [1]
查看完整版本: 专用于理解游戏场景的开源大模型-VideoGameBunny