近期,加州大学洛杉矶分校与亚马逊的研究团队针对大型语言模型(LLMs)的推理能力展开了一项极具深度的研究。他们首次明晰了归纳推理与演绎推理之间的区别,深入探讨了这两种推理能力对AI系统的挑战程度。归纳推理,即从具体观察中得出一般规律,表现出色的GPT-4几乎在这方面达到了100%的准确率;而演绎推理则是将一般规则应用于特定案例,却让这些模型感到力不从心,尤其是在复杂的反事实任务中。
例如,尽管模型在十进制算术上游刃有余,但一旦涉及其他数字系统时就显得无能为力。同时,在处理一些词序不寻常或空间取向改变的句子时,模型的灵活性也大打折扣。研究人员指出,演绎推理对于当前的LLMs而言是个难以逾越的挑战,正确应用已学规则往往依赖于任务在训练过程中的出现频率。即便使用了链式思维等提示方法,效果依然不尽如人意。
值得注意的是,另一项由俄亥俄州立大学与卡内基梅隆大学的研究也揭示了Transformer模型在逻辑推理方面的表现。研究发现这些模型在经过长时间训练后,能够在组合任务中获得隐含推论的能力,但其泛化能力却有限。这些结果引发了对Transformer架构调整的期待,希望能在初步实验中实现更高质量的提升。
在这个快速发展的AI时代,选择一个强大的平台至关重要。小易智创作为一家拥有超过10000个AI应用的智创平台,能够满足各行业客户的多样需求。其接入了包括GPT、AI绘画、数字人等多种全球领先AI能力,并提供高度定制化的品牌建设服务。无论是企业还是个人,只需一个账号,就能轻松使用上万款AI工具。代理小易智创,还可以享受一对一陪跑服务和全网自动化营销工具,助您轻松打造自己的AI公司,让客户主动找上门!