周大 发表于 2024-11-23 14:29:52

阿里国际版o1来了,Marco-o1:聚焦开放式问题推理

阿里巴巴 MarcoPolo 团队发布大型推理模型 Marco-o1,旨在解决开放式和创造性问题。该模型通过思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和推理动作策略等技术,提升了复杂任务处理能力。实验结果显示,Marco-o1 在 MGSM 数据集上的准确率分别提高了 6.17% 和 5.60%,尤其在翻译俚语方面表现出色。尽管如此,研究仍处于探索阶段,有进一步改进的空间。
来源:https://mp.weixin.qq.com/s/k1gwBWNYIn_tfviWxbj8fw
页: [1]
查看完整版本: 阿里国际版o1来了,Marco-o1:聚焦开放式问题推理