周大 发表于 2024-4-21 22:32:51

4K图像理解模型IXC2-4KHD

上海AI Lab和香港中文大学联合推出IXC2-4KHD模型,支持4K动态分辨率,在视觉问答模型中获得巨大成功,并展现出在高分辨率图像理解方面的出色能力。模型通过动态分辨率训练、切块布局信息和推理阶段扩展分辨率等设计,展现出潜力适应各种任务和场景。
来源:https://mp.weixin.qq.com/s/OKMFNeVhgGraMEQckMwlvA
页: [1]
查看完整版本: 4K图像理解模型IXC2-4KHD