专用于理解游戏场景的开源大模型-VideoGameBunny

[复制链接]
周大 发表于 2024-9-3 15:26:33 | 显示全部楼层 |阅读模式
加拿大研究人员开源了VGB大模型,旨在解决游戏场景理解与图像识别问题。VGB作为视觉AI助理,可帮助玩家掌握技巧,同时协助开发者识别并修复游戏中的bug。该模型基于Bunny模型开发,支持高分辨率图像处理,并结合了LLama-3-8B语言模型及SigLIP视觉编码器,训练数据涵盖413款游戏中的185,000多张图像。
来源:https://www.chinaz.com/2024/0903/1639860.shtml

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 12:39 , Processed in 0.296954 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表