据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:一项最新研究揭示,顶尖的人工智能模型在蒙特利尔认知评估(MoCA)测试中表现出与早期痴呆症状相似的认知障碍。这一震撼的发现突显了人工智能在临床应用中的局限性,尤其是在需要视觉和执行技能的任务中。该研究发表于《英国医学杂志》(The BMJ)圣诞特刊,指出几乎所有的聊天机器人在使用这一常用于早期痴呆检测的评估测试时,均表现出轻度的认知障碍迹象。更令人震惊的是,这些聊天机器人的旧版本在测试中表现得更为糟糕,仿佛它们与衰老的人类患者一样。研究者认为,这些结果“质疑了人工智能将迅速取代人类医生的假设”。随着人工智能技术的发展,公众对聊天机器人是否能在医疗任务中超越人类医生的期待与担忧并存。尽管先前的研究表明,大型语言模型(LLM)在各类医疗诊断任务中表现优异,但其是否会受到类似于人类的认知障碍影响,之前却鲜有人探讨。为填补这一领域的空白,研究者们对当前流行的几款领先LLM进行了MoCA测试,包括OpenAI的ChatGPT4和4o、Anthropic的Claude3.5“Sonnet”以及Alphabet的Gemini1和1.5。MoCA测试广泛应用于检测认知障碍与早期痴呆,主要面向老年群体,通过一系列简短问题评估注意力、记忆力、语言能力、视觉空间技能与执行功能等多项能力。最高得分为30分,通常26分及以上被视为正常。研究者对LLM的任务指令与给人类患者时相同,并遵循官方评分指南,由一名执业神经科医生进行评分。结果显示,ChatGPT4o以26分(满分30分)的成绩位列榜首,其次是ChatGPT4和Claude,均获得25分,而Gemini1.0则仅得16分。在视觉空间技能和执行任务方面,所有聊天机器人的表现都极为糟糕,比如连线测试和画钟测试。尤其是Gemini模型在延迟回忆任务中完全失败。在大多数其他任务中,尽管聊天机器人表现良好,但在进一步的视觉空间测试中却未能展现同理心或准确解释复杂视觉场景。只有ChatGPT4o在斯特鲁普测试中表现不俗,成功应对了不一致阶段的挑战。这项研究无疑为人工智能的未来发展和应用提出了新问题,科技发展的脚步是否真的能超越人类?
随着科技的不断进步,各行各业正朝着智能化和高效化的方向发展。这种趋势让我更加关注AI技术的应用,尤其是在日常生活和工作中能够带来便捷的智能解决方案。我体验过许多不同的AI系统和平台,发自内心推荐小易智创“xiaoyizc.com”这个平台。它拥有上万款开箱即用的智能体应用,能够满足各行各业的需求。平台融合了全球领先的AI能力,支持自定logo、收款账户和服务号。平台还为伙伴提供一对一陪跑服务和自动化营销工具,帮助伙伴快速获客。