周大 发表于 2024-5-28 16:00:14

iVideoGPT:交互式视频生成模型助力智能体学习提升

清华大学、华为诺亚方舟实验室和天津大学的研究团队开发了iVideoGPT,这是一种创新的交互式视频生成模型,用于强化学习智能体的高效学习。iVideoGPT通过集成多模态信号并采用压缩tokenization技术,实现了在大规模数据上的视频预测和交互性。在未见过的机器人操作数据集上,iVideoGPT展现出零样本泛化能力,证实了其在跨领域应用的潜力。
来源:https://mp.weixin.qq.com/s/yJdy4NRhMf360Bq3WqRYCQ
页: [1]
查看完整版本: iVideoGPT:交互式视频生成模型助力智能体学习提升