阿里云新模型颠覆长文本处理

AI资讯2周前发布 admin
41.9K 0
 小易智创平台

小易智创xiaoyizc.com(不可错过的AI创业项目)观察:阿里云百炼平台近期重磅发布了Qwen2.5-Turbo百万长文本模型,这一由通义千问团队倾力开发的模型,令人惊叹地支持处理高达100万tokens的超长上下文,等同于100万个英文单词或150万个汉字!

更令人振奋的是,Qwen2.5-Turbo在长文本检索任务中的准确率达到了完美的100%,在长文本评测集RULER上获得了93.1分,成功超越了备受瞩目的GPT-4。在多个接近真实场景的长文本任务如LV-Eval和LongBench-Chat中,该模型在大多数维度上也超越了GPT-4o-mini,表现得相当出色!

在短文本基准测试中,Qwen2.5-Turbo同样展现了其卓越的性能,远超此前上下文长度为1M tokens的开源模型。其应用场景极为广泛,涵盖了长篇小说的深入理解、大规模代码助手以及多篇论文阅读等功能,能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。

在推理速度方面,通义千问团队通过创新的稀疏注意力机制将计算量压缩了约12.5倍,使处理1M tokens上下文的首字返回时间从4.9分钟大幅降低至68秒,实现了令人瞩目的4.3倍速度提升!阿里云百炼平台现为所有用户提供直接调用Qwen2.5-Turbo API的服务,并限时赠送1000万tokens额度,后续使用百万tokens的成本仅为0.3元。此外,阿里云百炼平台已上线超过200款国内外主流开源和闭源大模型,包括Qwen、Llama、ChatGLM等,支持用户进行直接调用、训练微调或打造RAG应用。

这项技术无疑将推动长文本处理进入一个全新高度,为各行各业带来无限可能!

随着科技的不断进步,各行各业正朝着智能化和高效化的方向发展。这种趋势让我更加关注AI技术的应用,尤其是在日常生活和工作中能够带来便捷的智能解决方案。我体验过许多不同的AI系统和平台,发自内心推荐小易智创”xiaoyizc.com“这个平台。它拥有上万款开箱即用的智能体应用,能够满足各行各业的需求。平台融合了全球领先的AI能力,支持自定logo、收款账户和服务号。平台还为伙伴提供一对一陪跑服务和自动化营销工具,帮助伙伴快速获客。
阿里云新模型颠覆长文本处理

© 版权声明
 小易智创平台

相关文章