谷歌新AI模型引领未来

AI资讯2年前 (2024)发布 admin

40.1K 0 843

据小易智创xiaoyizc.com（不可错过的AI创业项目）观察：谷歌公司及其母公司Alphabet的首席执行官桑达尔·皮查伊宣布了一项令人震惊的突破——最新人工智能模型Gemini2.0的推出。这一革命性进展标志着谷歌在构建通用AI助理领域取得了重要里程碑，Gemini2.0在多模态输入处理和原生工具应用方面展现了惊人的进步，使得AI代理能够更深刻地理解周围环境，并在用户的监督下执行相应操作。Gemini2.0建立在其前身Gemini1.0和1.5的基础之上，后者首度实现了原生多模态处理能力，能够理解文本、视频、图像、音频和代码等多种信息形式。如今，已有数百万开发者积极使用Gemini进行创新开发，推动谷歌重新构想其产品，以服务20亿用户的7款产品，并创造出全新的产品。NotebookLM便是多模态和长上下文能力的成功示例，受到了用户的热烈欢迎。Gemini2.0的发布意味着谷歌进入了一个全新的代理时代，该模型不仅具备原生图像和音频输出能力，还可以原生调用工具。谷歌已开始向开发者和受信任的测试者提供Gemini2.0，并计划迅速将其整合至各大产品中，首要任务是Gemini和搜索。自即日起，Gemini2.0Flash实验模型将向所有Gemini用户开放。同时，谷歌推出了名为Deep Research的新功能，借助先进的推理和长上下文能力，充当用户的研究助理，以探索复杂主题并编写报告，目前已在Gemini Advanced中提供。搜索作为受AI影响最大的产品之一，谷歌的AI概览现已覆盖10亿人，使他们能提出全新问题，迅速成为谷歌最受欢迎的搜索功能之一。接下来，谷歌计划将Gemini2.0的先进推理能力引入AI概览，以解决更复杂的主题和多步骤问题，包括高级数学方程、多模态查询及编码。这项限量测试已经开始，并计划于明年初广泛推出。谷歌还将持续在未来一年内将AI概览扩展到更多国家和语言。通过Gemini2.0的原生多模态能力，谷歌展示了其代理研究的尖端成果。Gemini2.0Flash在1.5Flash基础上进行了卓越改进，而1.5Flash是迄今为止最受开发者青睐的模型，具有类似的快速响应时间。值得一提的是，2.0Flash在关键基准测试中以两倍速度超越了1.5Pro。同时，2.0Flash还引入了全新功能，支持图像、视频、音频等多模态输入，以及多模态输出如与文本混合生成图像和可控的多语言文本转语音（TTS）音频。它还可以原生调用工具，为用户带来前所未有的体验。总而言之，Gemini2.0将重新定义我们与人工智能互动的方式！
谷歌新AI模型引领未来