AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能
谷歌在 Gemini API 中全面推出 URL Context 功能,使 Gemini 模型能深度解析网页、PDF 和图像内容,支持 HTML、JSON、CSV 等多种格式,单个文件上限 34MB。该功能为开发者提供更精准的上下文处理能力,相比传统 RAG 技术省去提取、分块、矢量化等复杂流程。测试显示其可从特斯拉财报中准确提取特定表格数据与脚注信息。URL Context 采用缓存优先的两步检索机制,计费基于 Token 数量,不支持付费墙内容和专用格式。尽管并非取代 RAG,但标志着基础模型正逐步吸收外部处理能力,简化开发流程。来源:https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ
页:
[1]