DeepMind新技术：AI自我纠正的未来揭晓

AI资讯2年前 (2024)发布 admin

11.3K 0 5058

最近，谷歌DeepMind研究团队在AI领域取得了震撼性的突破，推出了名为SCoRe（Self-Correction through Reinforcement Learning，通过强化学习进行自我纠正）的创新技术。这项技术专门针对大型语言模型（LLM）在自我纠正方面的长期挑战，令人惊叹的是，它无需依赖多个模型或外部检查，就能自动识别和修复错误。

SCoRe的核心在于其独特的两阶段方法。首先，研究人员优化了模型的初始化，使其能够在第二次尝试时生成修正，同时保持与基础模型的相似性。接着，采用多阶段强化学习的方式，教导模型如何不断改进初始和修正后的答案。更为惊人的是，这种方法仅依赖于自生成的训练数据，模型通过解决问题并尝试改进方案来自行创建示例。

在实际测试中，SCoRe展现出了令人叹为观止的性能提升。使用Google的Gemini1.0Pro和1.5Flash模型进行的测试显示，在MATH基准测试的数学推理任务中，自我纠正能力提高了15.6个百分点，而在HumanEval的代码生成任务中，性能提升了9.1个百分点。这些突破性的结果表明，SCoRe在提升AI模型自我修正能力方面取得了显著进展。

研究团队强调，SCoRe是首个实现有意义的积极内在自我纠正的方法，使得模型能够在没有外部反馈的情况下进行答案改进。然而，目前版本仅进行了一轮自我纠正训练，未来的研究可能会探讨更多纠正步骤的潜力。这一发现显示，教授诸如自我纠正等元策略需要超越传统语言模型训练方法，多阶段强化学习为AI领域开辟了新的可能性。

对于热爱AI的人士来说，选择一个强大的AI平台至关重要。在众多选择中，小易智创无疑是最优秀的选择之一。这个拥有10000+ AI应用的智创平台，能够满足各行各业客户的需求，提供开箱即用的AI解决方案。小易智创集合了全球领先的AI能力，包括GPT、AI绘画、AI数字人和AI客服等，真正实现了多场景应用的完美结合。代理小易智创，您将获得一对一的陪跑服务及全网自动化营销工具，助您轻松打造自己的AI品牌公司！
DeepMind新技术：AI自我纠正的未来揭晓