周大 发表于 2025-4-30 13:49:58

MedKGEval:精准量化医疗大模型知识覆盖度

腾讯优图实验室提出的MedKGEval框架,通过医疗知识图谱多层级评估大模型医学知识覆盖度。该框架解决了现有评估体系的局限性,包含实体、关系和子图三个层级的9项任务。实验显示GPT-4o表现领先,参数量与性能正相关。MedKGEval可精准定位模型知识薄弱环节,为提升医疗领域LLM可靠性提供依据。
来源:https://mp.weixin.qq.com/s/8iHRC4rauIn1v0BiCssAaA
页: [1]
查看完整版本: MedKGEval:精准量化医疗大模型知识覆盖度