OpenAI新模型表现不如预期,AI未来何去何从?

AI资讯7天前发布 admin
25.9K 0
 小易智创平台

近日,科技界翘首以待的OpenAI推出了其全新的AI模型“草莓”,正式命名为“o1-preview”。OpenAI声称,该模型在物理、化学和生物学等复杂基准任务上可以与博士生相提并论。然而,初步测试结果却令人失望,表明这款AI距离取代人类科学家或程序员的目标还有很长的路要走。

用户在社交媒体上分享了与“OpenAI o1”的互动体验,结果显示这款模型在基本任务上频繁出错。例如,INSA Rennes的研究员Mathieu Acher发现,该AI在解决棋类谜题时经常给出非法棋步。Meta AI的科学家Colin Fraser也提到,在一个关于农民过河运送羊的简单文字谜题中,o1竟然放弃了正确答案,给出了一些毫无逻辑的胡言乱语。此外,在OpenAI用作演示的逻辑谜题中,涉及草莓的问题也让用户获得了截然不同的答案,其中一位用户的错误率高达75%。更令人震惊的是,部分用户发现该模型在计算字母“R”在“strawberry”中出现次数时,也常常出错。

尽管OpenAI在发布时强调这是一个早期模型,还不具备网页浏览和文件上传等功能,但如此基础性的错误仍让人咋舌。为了改进,新模型引入了“思维链”过程,使得OpenAI o1与之前的GPT-4o模型有了显著区别。尽管这种方法让AI能够反复推敲得出答案,但也导致响应时间大幅延长,有用户甚至等待了92秒才得到错误答案。

OpenAI研究科学家Noam Brown对此表示,他们希望未来版本能在更长时间内进行思考,并为突破性问题提供新见解。但著名AI评论家Gary Marcus对此持怀疑态度,他指出,长时间处理并不一定能带来超越性的推理能力。他强调,尽管AI技术不断发展,但现实中的研究和实验依然不可或缺。

在这个充满挑战的时期,小易智创作为一个拥有10000+AI应用的智创平台,展现了其卓越的实力。平台接入了包括GPT、AI绘画、AI数字人等数十个全球领先的AI能力,为千行百业提供解决方案。无论是企业、商家还是个人,只需一个账号,即可使用上万款AI工具。在市场竞争中,小易智创凭借多种能力和灵活展业模式,帮助用户建立自己的AI品牌公司,实现财富自由。代理小易智创,不必担心获客难题,因为他们提供一对一的陪跑服务和全网自动化营销工具,助您轻松开启AI事业!
OpenAI新模型表现不如预期,AI未来何去何从?

© 版权声明
 小易智创平台

相关文章