AI问答,直接「拍」给你看!来自快手可灵&香港城市大学

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
快手可灵团队与香港城市大学联合提出“视频作为答案”新范式,并推出VANS模型,能够根据当前视频内容生成下一步动作的定制化视频回答。该模型通过Joint-GRPO算法实现视觉语言模型与视频生成模型的协同优化,在程序性教学与未来预测任务中表现优异。实验显示,其在ROUGE-L指标上较最强基线提升近三倍,且在语义对齐与视频质量方面均领先,展现出在教育、创意及自动驾驶模拟等领域的广泛应用潜力。
来源:https://mp.weixin.qq.com/s/yqkZ7T-JJRH1OIz28Jv5iQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-28 00:49 , Processed in 0.263159 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表