上海交大翟广涛称完美AI评测体系等同AGI,评测不再重要时AGI或实现
上海交大教授翟广涛指出,当前AI评测体系存在数据污染、原子化评测偏差及脱离真实场景等问题,难以准确衡量模型的实际价值。他提出“以人为本”的评测理念,强调信息质量、问题解决与交互体验,并倡导建立动态演进、社区共建的评测生态。其团队开发的“司南”评测平台采用十万题库与AI裁判模型,探索“训评一体”机制,推动评测从外部度量走向内生驱动。翟广涛认为,完美评测体系的出现即代表通用人工智能的到来,评测的终极目标是引导AI健康发展,而非单纯追求分数。来源:https://mp.weixin.qq.com/s/iTzTyzOfHI15iZyn2wivdQ
页:
[1]