21.5万张X光，78万个问题！德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

周大发表于 2024-8-9 16:58:13

多模态大语言模型在医学视觉问答领域取得进展，但现有数据集规模小且问题简单。研究人员创建了Medical-CXR-VQA，一个包含78万个问答对的大规模X光胸片数据库，问题类型涵盖异常、位置等七种。使用LLM辅助构建规则，相比传统规则方法，准确率提高62%。
来源：https://mp.weixin.qq.com/s/Uapgvcyp_pmpXN1PsZpYvw

页: [1]

靠浦ai课堂's Archiver

21.5万张X光，78万个问题！德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA