阿里国际版o1来了，Marco-o1：聚焦开放式问题推理

周大发表于 2024-11-23 14:29:52

阿里巴巴 MarcoPolo 团队发布大型推理模型 Marco-o1，旨在解决开放式和创造性问题。该模型通过思维链（CoT）微调、蒙特卡洛树搜索（MCTS）和推理动作策略等技术，提升了复杂任务处理能力。实验结果显示，Marco-o1 在 MGSM 数据集上的准确率分别提高了 6.17% 和 5.60%，尤其在翻译俚语方面表现出色。尽管如此，研究仍处于探索阶段，有进一步改进的空间。
来源：https://mp.weixin.qq.com/s/k1gwBWNYIn_tfviWxbj8fw

页: [1]

靠浦ai课堂's Archiver

阿里国际版o1来了，Marco-o1：聚焦开放式问题推理