谷歌大模型终于迈开大步 Gemini对决GPT-4
稀土掘金
发表于 2023-12-8 10:00:37
212
0
0
距离ChatGPT发布,已经过去一年零一周。伴随着ChatGPT的发布,OpenAI成为了人工智能领域最耀眼的公司,尤其是在大模型领域,它也是其他所有科技公司的追赶目标,其中包括谷歌。
过去八年,谷歌一直把AI-first作为公司战略,2016年打败人类围棋冠军的AlphaGo便是出自谷歌之手。毫不夸张地说,是谷歌掀起的一股AI浪潮,改变了整个AI行业的发展,但现在,它亟需在大模型领域证明自己。
据悉,在Gemini 1.0版本中包含三个不同尺寸,分别是Gemini Ultra、Gemini Pro、Gemini Nano。其中,Gemini Nano主要应用于设备端,Pixel 8 Pro将是第一款搭载Gemini Nano的智能手机;Gemini Pro则适用于在各种任务中扩展,谷歌便计划用Gemini Pro来升级旗下的聊天机器人Bard,以及包括搜索、广告、Chrome等在内的更多谷歌产品。
对于功能最强悍的Gemini Ultra,谷歌称目前正在进行信任和安全检查,以及通过微调和基于人类反馈的强化学习(RLHF)进一步完善模型,预计明年初向开发人员和企业客户推出。
桑达尔·皮查伊表示,Gemini的发布,是人工智能发展的一个重要里程碑,也是谷歌新时代的开始。
超越GPT-4?
据谷歌DeepMind首席执行官黛米斯·哈萨比斯(Demis Hassabis)介绍,Gemini是由谷歌团队从头开始构建的多模态模型,这意味着它可以概括并无缝理解、处理不同类型的信息,包括文本、代码、音频、图像和视频。
在性能测试上,Gemini Ultra在32个大语言模型基准测试中的30个超过了当前最优成绩,另外在MMLU(大规模多任务语言理解)中,Gemini Ultra的得分为90%,成为首个超越人类专家的大模型。
黛米斯·哈萨比斯称,在测试图像基准过程中,Gemini Ultra在没有来自图像字符识别(OCR)系统的帮助下,就超越了此前最先进的模型。这些基准测试凸显了Gemini的多模态能力,也展现出其具有更复杂推理能力的早期迹象。
目前,创建多模态模型的标准方法主要是通过训练不同模态的单独组件,然后将它们拼接在一起。但这样操作的结果是,这些模型有时在执行某些任务(如描述图像)方面表现良好,但往往难以处理更复杂的推理。
“我们将Gemini设计为原生多模态,它从一开始就针对不同模态进行了预训练,然后我们使用额外的多模态数据对其进行微调,以进一步提高其效果。”黛米斯·哈萨比斯介绍道,“这帮助Gemini从头开始就能无缝理解和推理各种输入,远远优于现有的多模态模型,而且其能力在几乎所有领域都达到了最先进的水平。”
比如在推理方面,Gemini 1.0可以理解复杂的书面和视觉信息,它通过阅读、筛选和理解信息,能够从数十万份文档中提取见解。
另外,Gemini 1.0经过训练,可以同时识别和理解文本、图像、音频等,因此它能更好地理解微妙的信息,并能回答涉及复杂主题的问题,比如进行数学和物理等复杂学科的推理。
而在编码方面,Gemini 1.0能够理解、解释和生成世界上最流行的编程语言(如Python、Java、C++和Go)的高质量代码。两年前,谷歌曾推出AI代码生成平台AlphaCode,现在在Gemini的助力下,该平台迭代到AlphaCode 2,性能也得到大幅提升,可以解决之前几乎两倍数量的问题。
仍在持续优化安全性
桑达尔·皮查伊表示,现在已经有数百万人正在使用谷歌产品中的生成式AI,做一年前还做不到的事情,从回答更复杂的问题到使用新工具进行协作和创造。与此同时,开发人员正在使用谷歌的模型和基础架构构建新的生成式AI应用程序,全球的初创公司和企业也正在利用谷歌的AI工具不断成长。
在其看来,这种趋势已经有些令人难以置信,但是,这还仅仅是开始。
“我们正在大胆而负责任地开展这项工作。这意味着我们的研究要有雄心壮志,追求能够为人类和社会带来巨大利益的能力,同时也要建立保障措施,并与政府和专家合作,以应对随着AI变得更加强大而产生的风险。”桑达尔·皮查伊称。
因此在Gemini的开发过程中,谷歌也加强了安全审查工作。黛米斯·哈萨比斯介绍,在谷歌的AI原则和产品安全政策基础上,谷歌团队正为Gemini的多模态能力添加新的保护措施。
不仅如此,黛米斯·哈萨比斯还强调,在开发的每个阶段,谷歌都会考虑潜在风险,并努力测试和减轻它们。
据悉,Gemini具有到目前为止所有谷歌AI模型中最全面的安全评估,包括对偏见和有害信息的评估。同时,为了识别内部评估方法中的盲点,谷歌还在与各种外部专家和团队合作,对Gemini模型在各种问题上进行压力测试。
另外值得关注的是,Gemini的训练是基于谷歌自己的张量处理单元(TPUs)——v4和v5e。在这些TPUs上,Gemini比谷歌之前的模型运行速度更快、成本更低。所以除了新模型外,谷歌还宣布将推出新的TPU系统——Cloud TPU v5p,这是专为训练尖端AI模型而设计的,也将用于Gemini的开发。
有业内人士向记者表示,谷歌此次发布的Gemini虽然在很多性能上超越了GPT-4,但是它与OpenAI仍存在时间差,GPT-4发布已经半年多,新一代模型应该也在开发过程中。
“所以对谷歌而言,与GPT-4进行各种基准测试的比较,只是展现其现阶段能力的一方面,能否依靠自身积累以及强大的资源,缩短与OpenAI的时间差才是关键。”该人士指出。另外,Gemini作为谷歌在大模型时代构建的全新基础设施,比起测试数据,能否满足日常用户以及企业客户,才是检验Gemini能力的真正标准。
黛米斯·哈萨比斯表示,谷歌已经开始在搜索中试验Gemini,它使用户的搜索生成体验变得更快,在美国的英语搜索中,延迟减少了40%,同时在质量方面也有所提升。
而接下来,在加速Gemini 1.0落地应用的过程中,谷歌也在进一步扩展其未来版本的功能,包括增加上下文窗口以处理更多信息,进而提供更好的响应。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 百度李彦宏:过去24个月,AI行业最大变化是大模型基本消除了幻觉
- 「AI新世代」大模型厂商齐“卷”智能体,李彦宏称将迎来“靠想法就能赚钱时代”
- 李彦宏说大模型幻觉基本消除了 实测文心一言到底怎么样?
- 百度发布两款“超级有用”应用,李彦宏:大模型变得可用可信
- AI周报|杨植麟称kimi月活超3600万;李彦宏:大模型幻觉基本消除了
- 百度吴甜:大模型重塑产业智能引擎
- 大模型重塑产业智能引擎 百度分享文心大模型最新进展
- 文心一言用户数破4亿,百度吴甜:大模型正重塑产业智能引擎
- 阿里巴巴CEO吴泳铭:AI发展需要一批不同规模、不同领域的开源大模型
- 百度Q3核心净利润增长17%超预期 文心大模型日调用量达15亿
-
知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
- caffycat
- 昨天 11:18
- 支持
- 反对
- 回复
- 收藏
-
每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
- star8699
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
- goodfriendboy
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
- 3233340
- 昨天 17:06
- 支持
- 反对
- 回复
- 收藏