北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景

[复制链接]
周大 发表于 2024-5-30 16:15:27 | 显示全部楼层 |阅读模式
北京大学等研究团队推出EditWorld,这是一种新的图像编辑技术,旨在更准确地模拟物理世界的变化。借助GPT-3.5等模型,团队构建了一个多模态数据集,训练出的编辑模型在world-instructed图像编辑任务上表现优越,解决了现有方法在处理复杂视觉动态时的不足。该技术通过文本生成和视频分析获取多样化数据,并通过精细的人工复查提高数据质量。
来源:https://mp.weixin.qq.com/s/tFx-o7m4GgN0tiGDuSkddA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-17 05:34 , Processed in 0.305510 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表