周大 发表于 2024-5-30 16:15:27

北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景

北京大学等研究团队推出EditWorld,这是一种新的图像编辑技术,旨在更准确地模拟物理世界的变化。借助GPT-3.5等模型,团队构建了一个多模态数据集,训练出的编辑模型在world-instructed图像编辑任务上表现优越,解决了现有方法在处理复杂视觉动态时的不足。该技术通过文本生成和视频分析获取多样化数据,并通过精细的人工复查提高数据质量。
来源:https://mp.weixin.qq.com/s/tFx-o7m4GgN0tiGDuSkddA
页: [1]
查看完整版本: 北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景