周大 发表于 2025-6-26 14:48:38

港大开源RAG-Anything系统:突破多模态文档理解瓶颈,实现图文表公式统一处理

香港大学黄超教授团队开源新一代多模态RAG系统 **RAG-Anything**,首次实现对文字、图表、表格、数学公式等复杂文档内容的统一智能理解。该系统突破传统RAG仅支持纯文本的局限,通过三阶段架构(多模态解析、知识图谱构建、混合检索生成),有效解决跨模态语义关联缺失、检索精度不足等问题,并支持PDF、Office、图像等10余种主流格式。RAG-Anything提供一键式自动化与精细化控制两种使用模式,具备模块化与插件式设计,适用于学术研究、财务分析、工程制图等多个专业场景。该项目已在GitHub开源,用户可通过PyPI快速部署。
来源:https://mp.weixin.qq.com/s/lFKyKvm0luZTpx8_nGyWEw
页: [1]
查看完整版本: 港大开源RAG-Anything系统:突破多模态文档理解瓶颈,实现图文表公式统一处理