标签:AI视觉理解

火山引擎新模型引发智能革命?

据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:在2024年12月18日的火山引擎 FORCE 原动力大会上,火山引擎宣布了豆包大模型家族的重磅升级,并首次推...

新视觉语言模型 LLaVA-o1 能力惊人!

据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:近日,北京大学及其科研团队宣布推出一款令人瞩目的多模态开源模型——LLaVA-o1。该模型被誉为首个具备...

Vision Search Assistant的神秘面纱

据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:Vision Search Assistant(VSA)是一项划时代的技术,完美结合了视觉语言模型(VLMs)与网络代理,极...

GPT-4o发布,未来AI生活即将开启?

据小易智创xiaoyizc.com(不可错过的AI创业项目)观察:世界即将进入一个令人瞩目的新纪元!OpenAI于周一隆重推出的GPT-4o具备了前所未有的视觉理解能力,这...

Eagle:视觉理解的未来之星

在当今人工智能技术飞速发展的背景下,英伟达推出了令人惊叹的多模态大模型——Eagle。这一前沿科技的应用领域广泛,能够处理高达1024×1024像素的图像,展现出...

ORYX:AI视觉理解的未来之星

在人工智能的迅猛发展浪潮中,一个名为ORYX的多模态大型语言模型悄然崛起,正在颠覆我们对AI视觉理解能力的认知。这个由清华大学、腾讯和南洋理工大学联合研...

CogAgent:未来AI的全新助手

在科技迅猛发展的今天,清华大学与智谱AI联合推出了一款极具前瞻性的多模态视觉大模型——CogAgent。它专注于图形用户界面(GUI)的理解与导航,打破了传统文本...