阿里巴巴新推理模型引发关注

19.2K 0 7587

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：阿里巴巴国际AI团队近日推出了一款颇具创新性的推理模型Marco-o1。这款模型的独特之处在于，它不仅聚焦于传统的、有明确答案的领域如编程与数学，还致力于解决开放型问题，探索难以量化且缺乏明确奖励的领域。

Marco-o1的设计理念极为先进，利用超长CoT数据进行微调，结合蒙特卡罗树搜索（MCTS）来扩展解空间，以及细粒度的解空间扩展。这些功能使得模型在自我对弈和MCTS的结合下，生成了具备反思和纠正能力的超长CoT数据，并与其他开源数据进行整合训练。此外，研究团队还引入了mini-Step概念，以进一步拓宽模型的解空间，指导其输出更优质的答案。

在翻译任务中，Marco-o1展现出处理复杂长句翻译的非凡能力，这是首次将推理链路扩展应用于机器翻译。模型在推理过程中深入思考，举例来说，当需要输出单词“strawberry”中‘r’的数量时，模型会逐步拆解每一个字母并进行比较，从而确保最终结果的准确无误。在机器翻译领域，模型凭借推理链路成功识别难点，实现逐词翻译，显著提高了整体翻译质量。

研究团队还积极探索其他领域的应用，证明Marco-o1具备解决多种现实问题的潜力。通过自我对弈和MCTS构建的超长CoT数据，以及融入MarcoPolo家族的一些指令遵循数据集，进一步提升了模型的指令遵循能力。使用方面，研究团队提供了便捷的推理和微调代码，让用户轻松加载模型与分词器，快速开始聊天或微调。

Marco-o1模型的问世标志着阿里巴巴国际AI团队在推理模型领域迈出了重要一步，为解决开放型问题提供了崭新的思路与工具。整体来看，Marco-o1不仅是技术上的突破，更为未来智能化的应用提供了无限可能。
阿里巴巴新推理模型引发关注