专用于理解游戏场景的开源大模型-VideoGameBunny
加拿大研究人员开源了VGB大模型,旨在解决游戏场景理解与图像识别问题。VGB作为视觉AI助理,可帮助玩家掌握技巧,同时协助开发者识别并修复游戏中的bug。该模型基于Bunny模型开发,支持高分辨率图像处理,并结合了LLama-3-8B语言模型及SigLIP视觉编码器,训练数据涵盖413款游戏中的185,000多张图像。来源:https://www.chinaz.com/2024/0903/1639860.shtml
页:
[1]