谷歌nano香蕉模型革新图像生成：多图融合、二维转三维、精准理解物理结构

周大发表于 2025-8-29 14:52:21

谷歌推出全新图像模型nano banana，融合多图生成、地理结构理解与三维重建能力，结合Gemini世界知识和交错生成技术，实现“有记忆”的多轮图像创作。该模型支持上传最多13张图片拼接、现实标注、图像修复、风格转换等功能，已在测试平台LMArena引发热潮，盲测表现优于GPT-4o图像模型。其核心技术“原生与交错式生成”使模型能持续理解上下文并进行编辑，结合Imagen团队的审美优化，兼顾逻辑与视觉质量。未来，该模型有望成为主动提供创意建议的AI伙伴。
来源：https://mp.weixin.qq.com/s/qNqPOuj6wBbtifFPFoWpcw

页: [1]

靠浦ai课堂's Archiver

谷歌nano香蕉模型革新图像生成：多图融合、二维转三维、精准理解物理结构