DeepMind推出Michelangelo框架评估长上下文理解能力

周大发表于 2024-10-11 15:12:47

谷歌DeepMind提出Michelangelo框架，评估模型处理长上下文的能力。框架包含三个任务：Latent List、MRCR和IDK。实验表明，GPT和Claude在128K上下文内表现良好，Gemini则在1M上下文中有出色表现，但在复杂推理任务中，多数模型表现欠佳。
来源：https://mp.weixin.qq.com/s/ZKOqUjDUgXqz-debFn18uw

页: [1]

靠浦ai课堂's Archiver

DeepMind推出Michelangelo框架评估长上下文理解能力