周大 发表于 2025-1-20 14:57:28

微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告

微软开源文件转换工具MarkItDown,支持多种文件格式转为Markdown,并集成多模态LLM处理图片和音频。GitHub收藏超3万,提供命令行、API及Docker使用方式,且有在线版。哥伦比亚大学讲师测试显示,MarkItDown在经济预测数据提取中表现良好,但在结构化输出和资产类别权重解析方面不如IBM的Docling。MarkItDown可集成LLM进行图像描述,但存在一些不准确之处。
来源:https://mp.weixin.qq.com/s/iaX3fSydSBsUTly2QWJEEA
页: [1]
查看完整版本: 微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告