OpenAI探索视觉智能:语言模型的关键作用与未来挑战

[复制链接]
周大 发表于 2024-6-18 14:46:19 | 显示全部楼层 |阅读模式
在2024年智源大会上,OpenAI的Aditya Ramesh揭示了他们如何通过DALL·E、CLIP等项目推动视觉智能,强调了语言在这一过程中的核心地位。他提出,使用高度描述性的文本训练模型能有效提升效率,同时讨论了视频生成模型面临的可控性和物理模拟挑战。尽管面临困难,Aditya认为现有互联网视频数据已足够推动模型取得更大进展。
来源:https://mp.weixin.qq.com/s/ZNBq5UM6R1vckQPZAq9bSA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-6 16:59 , Processed in 0.286410 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表