谷歌Gemini 2.0深夜发布,全面升级Agent功能,能否撼动OpenAI地位?
作者:唯一手游网时间:2025-02-01 13:35:36
在科技巨头OpenAI宣布将连续12天发布更新的前夕,谷歌于12月11日深夜悄然推出了其新一代模型——Gemini 2.0。这一举动似乎是对OpenAI近期一系列发布动作的巧妙回击。
Gemini 2.0的发布标志着谷歌在AI领域的又一次重大突破,特别是针对Agent功能的强化。Agent功能,即智能体功能,使AI能够感知环境、执行任务,并在一定程度上自主做出决策,从而更加自动化地完成各种任务。
与OpenAI的发布内容相比,谷歌此次显得更为慷慨。OpenAI在凌晨两点的更新中,主要宣布了与Apple Intelligence的合作,这一合作被普遍期待能与Agent功能紧密相关。而谷歌则一次性发布了四个与Agent相关的功能,包括:
Project Astra,它允许用户在Gemini应用中直接调用Google Lens和地图功能,以解决各种实际问题。
Project Mariner,这是一个Chrome浏览器的实验性功能,用户可以通过简单的提示词,让AI代理在浏览器中浏览网页并完成各种任务。
Jules,一个可以嵌入GitHub的编程Agent。用户只需用自然语言描述问题,Jules就能生成可以直接合并到GitHub项目中的代码。
以及一个游戏Agent,它能够实时解读屏幕画面,在玩家打游戏时通过语音交流提供AI打法提示。
值得注意的是,Gemini 2.0 Flash及其API目前可免费使用,用户可以通过Google AI Studio和Vertex AI中的Gemini API进行访问,每分钟最多可提问15次,每天最多1500次,预计明年初将全面开放。
Gemini 2.0 Flash作为2.0家族的首个模型,不仅主推原生多模态输入输出和Agent功能,而且速度比1.5 Pro快两倍,关键性能指标甚至超越了1.5 Pro。它还支持原生工具调用、实时音视频流输入等新功能。
Gemini 2.0在多模态、文本、代码、视频、空间理解和推理能力等方面都实现了全面提升。例如,在空间理解方面,利用Spatial Understanding功能,用户可以上传一张图片,Gemini将快速进行物体检测和标注,并生成结构化的数据(JSON格式)。这一功能可能广泛应用于机器学习训练数据准备、图像分析或计算机视觉研究等领域。
Gemini 2.0还支持全新的输出模态,包括文本、音频和图像的集成响应,多语言原生音频输出(8种高品质语音),以及原生图像输出。用户还可以进行多轮编辑迭代,直到生成满意的图像。
在原生工具使用方面,Gemini 2.0可以直接调用Google搜索、代码执行等工具,还能通过函数调用使用自定义的第三方函数。多模态实时API则支持实时音视频流输入,进行语音活动检测,并能集成多个工具完成复杂任务。
谷歌正在积极探索AI“代理”的应用,旨在打造能够自主理解、规划和执行任务的智能助手。他们已推出了一系列Agent原型(目前仅供测试人员使用),展示了AI代理在不同领域的巨大潜力。
例如,Jules可以作为AI编程伙伴,帮助开发者处理Python和Java的编码任务,与GitHub工作流无缝集成,高效地修改多个文件,甚至准备pull requests。Colab数据科学代理则可以帮助用户完成繁琐的数据分析工作,只需用自然语言描述分析目标,Colab就能自动生成一个完整的notebook,并在几分钟内提供洞察。
Project Mariner则致力于探索人机交互的未来,从浏览器开始。它是一个实验性的Chrome扩展程序,可以让AI代理在浏览器中执行各种任务,如查找信息、填写表格等。
在游戏领域,谷歌也利用DeepMind在游戏AI方面的丰富经验,将Gemini 2.0应用于游戏代理的开发。这些代理不仅能陪伴玩家一起玩游戏,还能提供专业的指导,并连接到Google搜索,获取海量的游戏知识。
除了Gemini 2.0的发布,谷歌还宣布了最新量子芯片Willow的推出。谷歌首席执行官孙达尔·皮柴称其为迈向打造实用量子计算机的重要一步。Willow在扩展量子比特数量、减少错误以及提高性能方面取得了显著成就,为解决量子纠错领域的难题提供了新的思路。
相关文章
-
英雄联盟转区全攻略:助你轻松迁徙,开启全新战场!
在热门电竞游戏《英雄联盟》(LOL)的世界里,玩家群体总是充满探索精神,不断寻找最适合自己的游戏舞台。转区,这一操作成为了许多玩家调整游戏体验的重要选择,无论是出于对网络环境的考量,还是对游戏文化的向
-
XL司令第二季为什么没有马赛语翻译版本?可能的原因与解决办法:解读该问题背后的因素
《XL司令》第二季无马赛是否有翻译的问题,最近吸引了不少观众的关注。尤其是对于非英语地区的观众来说,这部动画的可观看性会受到是否有翻译的影响。关于这部作品是否提供了马赛(Marsi)语翻译,也成为了讨论的焦点。不同于常见的英语或日语翻译,马赛语的翻译需求较为特殊。因此,很多人开始询问该剧是否能够提供
-
如何通过面膜和下部贴片实现全身护理?有效的护肤方法是什么?
面膜和局部护理已经成为现代生活中人们日常保养的一部分。特别是面膜产品的使用,逐渐成为了提升皮肤状态和恢复健康肤质的重要工具。而对于身体部位的护理,尤其是胸口和下部区域的护理,也被越来越多的人关注。在这篇文章中,我们将探讨“一面膜胸口一面吃下部位片段”这一主题,如何通过不同的护理手段,帮助提升身体的整
-
四川BBBBB毛毛多是什么?它的独特魅力在哪里?
四川BBBBB毛毛多,这个名字可能让很多人感到好奇,它究竟代表着什么?为什么这么多人对它津津乐道?说到四川美食,很多人会想到麻辣火锅、担担面等经典菜肴,但这个名字却让人摸不着头脑。事实上,“BBBBB
-
Sora问世,中国视频生成模型赛道如何出牌?
自OpenAI在今年2月16日首次发布Sora以来,这款视频生成模型一直备受争议,被部分业内人士戏称为“技术期货”。然而,在长达近十个月的等待后,Sora终于在12月10日以正式版的姿态亮相,宣称能够
-
大BBBBBB老人的爱情与财运:如何在生活中平衡爱情与财富,才能收获真正的幸福?
大BBBBBB老人是一个让人津津乐道的角色,他的爱情与财运充满了传奇色彩。从他的一生可以看出,爱情与财富对他来说并非偶然,而是通过他独特的生活方式与积极的态度获得的。从他的经历中,我们也能看出一些关于爱情与财富的深刻启示。