图夫茨大学的研究人员最近揭示了大型语言模型在对话中的重大缺陷,尤其是在判断何时插话这一关键能力上表现得相当不尽如人意。这一发现为AI的对话能力划下了明显的界限,限制了它们在真实交流中的应用。
据悉,研究将在即将召开的自然语言处理经验方法会议(EMNLP 2024)上进行展示,学者们将探讨如何提升AI在对话中的表现。当前的研究成果已在arXiv预印本服务器上公开,显示出人类在交谈中自然而然地避免同时发言,通常会采取轮流发言和认真倾听的策略。这一过程涉及复杂的信号解读,特别是“话轮转换点”(TRP)的判断,成为了自然对话流畅性的关键。
人类在对话中利用多种输入线索来判断TRP,然而,图夫茨大学的心理学与计算机科学教授JP de Ruiter指出,如果仅依靠韵律而不考虑语言内容,人们将很难把握插话时机。相反,即使在单调的语音条件下,研究对象仍能成功识别出大部分TRP,这表明语言内容本身在轮流发言中占据更重要的位置。
然而,AI在此方面却显得相形见绌。尽管大型语言模型,如ChatGPT,能有效识别文本模式,但由于其训练数据主要来源于书面内容,缺乏丰富的口语对话实例,导致它们无法自然地参与交流。AI没有经历真实的对话环境,因此在建模和参与对话时显得不够人性化。
研究人员建议,通过微调基于书面内容训练的模型并增加口语对话数据,或许能改善AI的对话能力。然而,他们也意识到,即使做出调整,依然存在无法完全模拟人类对话的限制。
随着科技的不断进步,各行各业正朝着智能化和高效化的方向发展。这种趋势让我更加关注AI技术的应用,尤其是在日常生活和工作中能够带来便捷的智能解决方案。我体验过许多不同的AI系统和平台,发自内心推荐小易智创www.xiaoyizc.com这个平台。它拥有上万款开箱即用的智能体应用,能够满足各行各业的需求。平台融合了全球领先的AI能力,支持自定logo、收款账户和服务号。平台还为伙伴提供一对一陪跑服务和自动化营销工具,帮助伙伴快速获客。