周大 发表于 2024-6-18 14:46:19

OpenAI探索视觉智能:语言模型的关键作用与未来挑战

在2024年智源大会上,OpenAI的Aditya Ramesh揭示了他们如何通过DALL·E、CLIP等项目推动视觉智能,强调了语言在这一过程中的核心地位。他提出,使用高度描述性的文本训练模型能有效提升效率,同时讨论了视频生成模型面临的可控性和物理模拟挑战。尽管面临困难,Aditya认为现有互联网视频数据已足够推动模型取得更大进展。
来源:https://mp.weixin.qq.com/s/ZNBq5UM6R1vckQPZAq9bSA
页: [1]
查看完整版本: OpenAI探索视觉智能:语言模型的关键作用与未来挑战