周大 发表于 2024-8-9 16:58:13

21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA

多模态大语言模型在医学视觉问答领域取得进展,但现有数据集规模小且问题简单。研究人员创建了Medical-CXR-VQA,一个包含78万个问答对的大规模X光胸片数据库,问题类型涵盖异常、位置等七种。使用LLM辅助构建规则,相比传统规则方法,准确率提高62%。
来源:https://mp.weixin.qq.com/s/Uapgvcyp_pmpXN1PsZpYvw
页: [1]
查看完整版本: 21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA