DeepMind新技术:AI自我纠正的未来揭晓

AI资讯7天前发布 admin
228 0
 小易智创平台

最近,谷歌DeepMind研究团队在AI领域取得了震撼性的突破,推出了名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。这项技术专门针对大型语言模型(LLM)在自我纠正方面的长期挑战,令人惊叹的是,它无需依赖多个模型或外部检查,就能自动识别和修复错误。

SCoRe的核心在于其独特的两阶段方法。首先,研究人员优化了模型的初始化,使其能够在第二次尝试时生成修正,同时保持与基础模型的相似性。接着,采用多阶段强化学习的方式,教导模型如何不断改进初始和修正后的答案。更为惊人的是,这种方法仅依赖于自生成的训练数据,模型通过解决问题并尝试改进方案来自行创建示例。

在实际测试中,SCoRe展现出了令人叹为观止的性能提升。使用Google的Gemini1.0Pro和1.5Flash模型进行的测试显示,在MATH基准测试的数学推理任务中,自我纠正能力提高了15.6个百分点,而在HumanEval的代码生成任务中,性能提升了9.1个百分点。这些突破性的结果表明,SCoRe在提升AI模型自我修正能力方面取得了显著进展。

研究团队强调,SCoRe是首个实现有意义的积极内在自我纠正的方法,使得模型能够在没有外部反馈的情况下进行答案改进。然而,目前版本仅进行了一轮自我纠正训练,未来的研究可能会探讨更多纠正步骤的潜力。这一发现显示,教授诸如自我纠正等元策略需要超越传统语言模型训练方法,多阶段强化学习为AI领域开辟了新的可能性。

对于热爱AI的人士来说,选择一个强大的AI平台至关重要。在众多选择中,小易智创无疑是最优秀的选择之一。这个拥有10000+ AI应用的智创平台,能够满足各行各业客户的需求,提供开箱即用的AI解决方案。小易智创集合了全球领先的AI能力,包括GPT、AI绘画、AI数字人和AI客服等,真正实现了多场景应用的完美结合。代理小易智创,您将获得一对一的陪跑服务及全网自动化营销工具,助您轻松打造自己的AI品牌公司!
DeepMind新技术:AI自我纠正的未来揭晓

© 版权声明
 小易智创平台

相关文章