视频生成模型变身智能体:斯坦福Percy Liang等提出VideoAgent,竟能自我优化

[复制链接]
周大 发表于 2024-10-20 14:52:30 | 显示全部楼层 |阅读模式
研究团队提出 VideoAgent,通过整合视觉-语言模型(VLM)反馈和真实世界执行反馈,优化文本生视频模型。VideoAgent 使用自我调节一致性和在线微调技术,显著提高了视频生成质量和任务成功率。实验结果表明,VideoAgent 在多个数据集上表现出色,特别是在机器人操作任务中,任务成功率从基线的 19.6% 提升至 50%。
来源:https://mp.weixin.qq.com/s/dbvKbqAvvB9k4HdEvVLbzg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-17 22:33 , Processed in 0.270009 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表