AI读网页，这次真不一样了，谷歌Gemini解锁「详解网页」新技能

周大发表于 2025-9-2 13:45:31

谷歌在 Gemini API 中全面推出 URL Context 功能，使 Gemini 模型能深度解析网页、PDF 和图像内容，支持 HTML、JSON、CSV 等多种格式，单个文件上限 34MB。该功能为开发者提供更精准的上下文处理能力，相比传统 RAG 技术省去提取、分块、矢量化等复杂流程。测试显示其可从特斯拉财报中准确提取特定表格数据与脚注信息。URL Context 采用缓存优先的两步检索机制，计费基于 Token 数量，不支持付费墙内容和专用格式。尽管并非取代 RAG，但标志着基础模型正逐步吸收外部处理能力，简化开发流程。
来源：https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ

页: [1]

靠浦ai课堂's Archiver

AI读网页，这次真不一样了，谷歌Gemini解锁「详解网页」新技能