AI视觉理解 | AI导航 ai123.cn

火山引擎新模型引发智能革命？

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：在2024年12月18日的火山引擎 FORCE 原动力大会上，火山引擎宣布了豆包大模型家族的重磅升级，并首次推...

AI资讯

2年前 (2025)

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：近日，北京大学及其科研团队宣布推出一款令人瞩目的多模态开源模型——LLaVA-o1。该模型被誉为首个具备...

AI资讯

2年前 (2024)

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：Vision Search Assistant（VSA）是一项划时代的技术，完美结合了视觉语言模型（VLMs）与网络代理，极...

AI资讯

2年前 (2024)

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：世界即将进入一个令人瞩目的新纪元！OpenAI于周一隆重推出的GPT-4o具备了前所未有的视觉理解能力，这...

AI资讯

2年前 (2024)

在当今人工智能技术飞速发展的背景下，英伟达推出了令人惊叹的多模态大模型——Eagle。这一前沿科技的应用领域广泛，能够处理高达1024×1024像素的图像，展现出...

AI资讯

2年前 (2024)

在人工智能的迅猛发展浪潮中，一个名为ORYX的多模态大型语言模型悄然崛起，正在颠覆我们对AI视觉理解能力的认知。这个由清华大学、腾讯和南洋理工大学联合研...

AI资讯

2年前 (2024)

在科技迅猛发展的今天，清华大学与智谱AI联合推出了一款极具前瞻性的多模态视觉大模型——CogAgent。它专注于图形用户界面（GUI）的理解与导航，打破了传统文本...

AI资讯

2年前 (2024)