阿里国际版o1来了,Marco-o1:聚焦开放式问题推理
阿里巴巴 MarcoPolo 团队发布大型推理模型 Marco-o1,旨在解决开放式和创造性问题。该模型通过思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和推理动作策略等技术,提升了复杂任务处理能力。实验结果显示,Marco-o1 在 MGSM 数据集上的准确率分别提高了 6.17% 和 5.60%,尤其在翻译俚语方面表现出色。尽管如此,研究仍处于探索阶段,有进一步改进的空间。来源:https://mp.weixin.qq.com/s/k1gwBWNYIn_tfviWxbj8fw
页:
[1]