AI问答，直接「拍」给你看！来自快手可灵&香港城市大学

周大发表于 6 天前

快手可灵团队与香港城市大学联合提出“视频作为答案”新范式，并推出VANS模型，能够根据当前视频内容生成下一步动作的定制化视频回答。该模型通过Joint-GRPO算法实现视觉语言模型与视频生成模型的协同优化，在程序性教学与未来预测任务中表现优异。实验显示，其在ROUGE-L指标上较最强基线提升近三倍，且在语义对齐与视频质量方面均领先，展现出在教育、创意及自动驾驶模拟等领域的广泛应用潜力。
来源：https://mp.weixin.qq.com/s/yqkZ7T-JJRH1OIz28Jv5iQ

		自动登录	找回密码
密码			立即注册

课程导航

AI问答，直接「拍」给你看！来自快手可灵&香港城市大学