周大 发表于 2024-9-14 14:46:36

一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024

中科院自动化所与阿里云合作开发的AddressCLIP街景定位大模型,基于CLIP实现街道级精度定位,只需一张照片即可确定具体位置。该模型克服了传统图像地理定位方法的局限,效果显著优于通用多模态模型,并入选ECCV2024会议。未来有望应用于社交媒体个性化推荐等领域。
来源:https://mp.weixin.qq.com/s/xW7vhix2n3yu42bFvhgUGQ
页: [1]
查看完整版本: 一张图实现街道级定位,端到端图像地理定位大模型AddressCLIP登ECCV2024