李彦宏内部讲话曝光:未来大模型之间的差距可能越来越大
我爱霍启刚掖
发表于 2024-9-11 17:34:16
136
0
0
榜单不代表大模型实力
对于行业“大模型之间的能力已经没有壁垒”的说法,李彦宏坦言,“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了,但这并不表明和最先进的模型就没有差距。”
他解释说,很多模型为了证明自己,会在发布之后去打榜,会去猜测试题目、答题技巧。从榜单看,或许模型的能力已经很接近了,但到实际应用中,还是有明显的差距。
李彦宏认为,模型之间的差距是多维度的。行业往往更关注理解、生成、逻辑、记忆等能力差距,但却忽视了成本、推理速度等维度。有些模型虽能达到同样效果,但成本高、推理速度慢。
李彦宏在内部讲话中表示,真正要衡量大模型的能力,应该是在具体的应用场景中,看是否能满足用户需求、产生价值增益,这才是最值得被在乎的。
应客观看待开源模型的效率问题
李彦宏进一步阐释了外界对于开源大模型的认知误区。“在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。”他解释说,比如开源的Linux,因为已经有了电脑,所以使用Linux是免费的。但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,无法实现算力的高效利用。
“效率上开源模型是不行的,”他表示,“ 闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU。GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”
李彦宏认为,在教学科研等领域,开源模型是有价值的;但在商业领域,当用户追求的是效率、效果和最低成本时,开源模型就没有了优势。
智能体还不是行业共识
李彦宏还谈及了大模型应用的发展阶段,他认为,首先出现的是Copilot,对人进行辅助;接下来是Agent智能体,有一定的自主性,能自主使用工具、反思、自我进化;这种自动化程度再发展,就会变成AI Worker,能独立完成各方面的工作。
当前,智能体已经受到越来越多的大模型公司及客户关注,李彦宏认为,虽然有很多人看好智能体这个发展方向,但是到今天为止,智能体还不是共识。像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。
为什么要强调智能体?李彦宏也给出了答案。智能体的门槛确实很低,很多人不知道怎么把大模型变成应用,而智能体是一个非常直接、高效、简单的方式,在模型之上构建智能体相当方便。目前,每周都有上万个新的智能体在百度文心智能体平台上被创造出来,智能体的日均分发次数已快速增长至800万次。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- 何小鹏:小鹏车端大模型明年目标实现百公里接管1次
- 何小鵬:小鵬車端大模型来年100キロ接収1回を目標
- 撞上数据墙?OpenAI模型提升速度放缓 着手调整开发策略
- 李彦宏:文心大模型日均调用量超15亿 较一年前增长30倍
- 李彦宏:文心大模型の1日平均使用量が15億を超え、1年前より30倍増加
- DeepMind开源生物分子预测模型 诺奖成果将掀起AI制药浪潮?
- 百度李彦宏:过去24个月,AI行业最大变化是大模型基本消除了幻觉
- 「AI新世代」大模型厂商齐“卷”智能体,李彦宏称将迎来“靠想法就能赚钱时代”
- 李彦宏说大模型幻觉基本消除了 实测文心一言到底怎么样?
- 百度发布两款“超级有用”应用,李彦宏:大模型变得可用可信
-
据媒体报道,OpenAI正准备推出一款代号为“Operator”的全新AI助理产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品,首 ...
- 永远的希望
- 昨天 11:06
- 支持
- 反对
- 回复
- 收藏
-
【小摩辣评“特朗普2.0”:关税大棒料打击经济、重燃通胀!】摩根大通资产管理公司(JPMorgan Asset Management)首席全球市场策略师David Kelly周三表示,当选总统特朗普激进的关税计划,可能会减缓全球经济,并给 ...
- besharp
- 昨天 12:37
- 支持
- 反对
- 回复
- 收藏
-
本报讯 (记者李豪悦)11月12日,腾讯音乐娱乐集团(以下简称“腾讯音乐”)宣布其截至2024年9月30日止第三季度的未经审计财务业绩。 2024年第三季度,腾讯音乐娱乐集团业绩表现稳健,总收入为70.2亿元,同 ...
- 覃志辉
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
新华财经上海11月13日电芯片制造商英伟达和软银集团的电信部门软银公司周三表示,两家公司已经试运行了全球首个人工智能和5G电信网络。 两家公司表示,该网络可以同时运行人工智能和5G工作负载,这一过程被 ...
- 惡魔獵人
- 前天 12:36
- 支持
- 反对
- 回复
- 收藏