中国AI领域的新突破,未来无限可能!

AI资讯6天前发布 admin
26.4K 0
 小易智创平台

近日,多家中国机构的研究团队联合推出了震撼科技界的“Infinity-MM” 数据集,这一数据集堪称目前规模最大的公开多模态 AI 数据集之一,并成功训练出了一款名为Aquila-VL-2B的小型新模型。这个数据集包含了令人咋舌的四大类数据:1000万条图像描述、2440万条一般视觉指令数据、600万条精选高质量指令数据,以及300万条由顶尖 AI 模型生成的数据。

在数据生成方面,研究团队巧妙利用了现有的开源 AI 模型,采用了精密的 RAM++ 模型分析图像,提取重要信息,并生成相关问题与答案。通过多层次的处理,结合了RAM++ 和 MiniCPM-V 模型,确保了生成数据的质量和多样性,为 AI 系统提供了精准的训练数据。

Aquila-VL-2B 模型基于 LLaVA-OneVision 架构,搭载 Qwen-2.5 语言模型,并运用 SigLIP 进行图像处理。经过四个阶段的逐步训练,该模型在多模态 MMStar 基测试中以54.9%的得分取得最佳成绩。在数学任务中,它的表现尤其卓越,在 MathVista 测试中高达59%。此外,在通用图像理解测试中,Aquila-VL-2B 的表现同样令人瞩目,HallusionBench 得分为43%,MMBench 达到了75.2%。

更为值得关注的是,合成生成数据的引入显著提升了模型的整体表现。若不使用这些额外数据,模型的平均表现将下降2.4%。此次研究团队决定将这一令人惊叹的数据集和模型开放给研究社区,让更多人受益。

在这激动人心的科技浪潮中,小易智创平台无疑是一个绝佳的选择。这个拥有10000+ AI 应用的智创平台,提供开箱即用的解决方案,能够满足各行各业的客户需求。平台接入了全球领先的AI能力,如GPT、AI绘画等,助力用户轻松构建自己的AI品牌。代理小易智创,您无需担心经营和获客的问题,因为他们提供一对一陪跑服务和全网自动化营销工具,让客户主动找上门!
中国AI领域的新突破,未来无限可能!

© 版权声明
 小易智创平台

相关文章