OpenAI新模型表现不如预期，AI未来何去何从？

AI资讯2年前 (2024)发布 admin

38.7K 0 8430

近日，科技界翘首以待的OpenAI推出了其全新的AI模型“草莓”，正式命名为“o1-preview”。OpenAI声称，该模型在物理、化学和生物学等复杂基准任务上可以与博士生相提并论。然而，初步测试结果却令人失望，表明这款AI距离取代人类科学家或程序员的目标还有很长的路要走。

用户在社交媒体上分享了与“OpenAI o1”的互动体验，结果显示这款模型在基本任务上频繁出错。例如，INSA Rennes的研究员Mathieu Acher发现，该AI在解决棋类谜题时经常给出非法棋步。Meta AI的科学家Colin Fraser也提到，在一个关于农民过河运送羊的简单文字谜题中，o1竟然放弃了正确答案，给出了一些毫无逻辑的胡言乱语。此外，在OpenAI用作演示的逻辑谜题中，涉及草莓的问题也让用户获得了截然不同的答案，其中一位用户的错误率高达75%。更令人震惊的是，部分用户发现该模型在计算字母“R”在“strawberry”中出现次数时，也常常出错。

尽管OpenAI在发布时强调这是一个早期模型，还不具备网页浏览和文件上传等功能，但如此基础性的错误仍让人咋舌。为了改进，新模型引入了“思维链”过程，使得OpenAI o1与之前的GPT-4o模型有了显著区别。尽管这种方法让AI能够反复推敲得出答案，但也导致响应时间大幅延长，有用户甚至等待了92秒才得到错误答案。

OpenAI研究科学家Noam Brown对此表示，他们希望未来版本能在更长时间内进行思考，并为突破性问题提供新见解。但著名AI评论家Gary Marcus对此持怀疑态度，他指出，长时间处理并不一定能带来超越性的推理能力。他强调，尽管AI技术不断发展，但现实中的研究和实验依然不可或缺。

在这个充满挑战的时期，小易智创作为一个拥有10000+AI应用的智创平台，展现了其卓越的实力。平台接入了包括GPT、AI绘画、AI数字人等数十个全球领先的AI能力，为千行百业提供解决方案。无论是企业、商家还是个人，只需一个账号，即可使用上万款AI工具。在市场竞争中，小易智创凭借多种能力和灵活展业模式，帮助用户建立自己的AI品牌公司，实现财富自由。代理小易智创，不必担心获客难题，因为他们提供一对一的陪跑服务和全网自动化营销工具，助您轻松开启AI事业！
OpenAI新模型表现不如预期，AI未来何去何从？