周大 发表于 2025-8-29 14:52:21

谷歌nano香蕉模型革新图像生成:多图融合、二维转三维、精准理解物理结构

谷歌推出全新图像模型nano banana,融合多图生成、地理结构理解与三维重建能力,结合Gemini世界知识和交错生成技术,实现“有记忆”的多轮图像创作。该模型支持上传最多13张图片拼接、现实标注、图像修复、风格转换等功能,已在测试平台LMArena引发热潮,盲测表现优于GPT-4o图像模型。其核心技术“原生与交错式生成”使模型能持续理解上下文并进行编辑,结合Imagen团队的审美优化,兼顾逻辑与视觉质量。未来,该模型有望成为主动提供创意建议的AI伙伴。
来源:https://mp.weixin.qq.com/s/qNqPOuj6wBbtifFPFoWpcw
页: [1]
查看完整版本: 谷歌nano香蕉模型革新图像生成:多图融合、二维转三维、精准理解物理结构