周大 发表于 2024-10-11 15:12:47

DeepMind推出Michelangelo框架评估长上下文理解能力

谷歌DeepMind提出Michelangelo框架,评估模型处理长上下文的能力。框架包含三个任务:Latent List、MRCR和IDK。实验表明,GPT和Claude在128K上下文内表现良好,Gemini则在1M上下文中有出色表现,但在复杂推理任务中,多数模型表现欠佳。
来源:https://mp.weixin.qq.com/s/ZKOqUjDUgXqz-debFn18uw
页: [1]
查看完整版本: DeepMind推出Michelangelo框架评估长上下文理解能力