OpenAI探索视觉智能：语言模型的关键作用与未来挑战

周大发表于 2024-6-18 14:46:19

在2024年智源大会上，OpenAI的Aditya Ramesh揭示了他们如何通过DALL·E、CLIP等项目推动视觉智能，强调了语言在这一过程中的核心地位。他提出，使用高度描述性的文本训练模型能有效提升效率，同时讨论了视频生成模型面临的可控性和物理模拟挑战。尽管面临困难，Aditya认为现有互联网视频数据已足够推动模型取得更大进展。
来源：https://mp.weixin.qq.com/s/ZNBq5UM6R1vckQPZAq9bSA

页: [1]

靠浦ai课堂's Archiver

OpenAI探索视觉智能：语言模型的关键作用与未来挑战