上海交大翟广涛称完美AI评测体系等同AGI,评测不再重要时AGI或实现

[复制链接]
周大 发表于 2025-7-15 14:19:36 | 显示全部楼层 |阅读模式
上海交大教授翟广涛指出,当前AI评测体系存在数据污染、原子化评测偏差及脱离真实场景等问题,难以准确衡量模型的实际价值。他提出“以人为本”的评测理念,强调信息质量、问题解决与交互体验,并倡导建立动态演进、社区共建的评测生态。其团队开发的“司南”评测平台采用十万题库与AI裁判模型,探索“训评一体”机制,推动评测从外部度量走向内生驱动。翟广涛认为,完美评测体系的出现即代表通用人工智能的到来,评测的终极目标是引导AI健康发展,而非单纯追求分数。
来源:https://mp.weixin.qq.com/s/iTzTyzOfHI15iZyn2wivdQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 16:56 , Processed in 0.278836 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表