Meta发布最强开源大模型追赶GPT-4,小扎:明年反超
史剑浇
发表于 2024-7-24 14:01:00
1081
0
0
除了发布产品,扎克伯格还发布了一份名为《开源人工智能是前进之路》的“开源宣言”。扎克伯格在文中表示,“今天,有几家科技公司正在开发领先的封闭模型。但开源正在迅速缩小差距。”
开源Llama 3.1-405B性能赶上了闭源GPT-4
据官方资料,Llama 3.1在超过15万亿个token的数据上进行训练,用了16000块H100。使用的预训练数据,截至到2023年12月。为了保证训练稳定性,只用了Transformer模型架构进行调整,而不是现在流行的混合专家模型(MoE)架构。
目前,Llama 3.1已支持各国语言对话,此次共发布了8B、70B和 405B三个尺寸,上下文长度都提升到了128K。硅基智能创始人司马华鹏对此评价称,Llama 3.1信息处理能力大幅度提升,“打个比方,就像从只能记住4000个中文字提升到能记住64000个中文字”。
长久以来,业界对于开闭源的讨论层出不穷。就在本月的世界人工智能大会上,百度创始人、董事长兼首席执行官李彦宏还在现场再次表示“商业化的闭源模型是最能打的”。李彦宏称,开源模型在一些学术研究、教学领域有存在价值,可以用于研究大模型的工作机制,形成理论。但当处于激烈的商业环境中,想要让业务效率高于同行、成本低于同行,商业化的闭源模型是“最能打的”。
不过,根据Meta提供的基准测试数据,开源模型此番也很“能打”。其中Llama 3.1最受关注的405B(4050亿参数),从性能上已经可媲美GPT-4和Claude 3,这意味着已有顶尖开源大模型性已能赶上了旗舰闭源大模型。
值得关注的是,此次开源更为彻底。在今年4月推出产品Llama 3 8B和Llama 3 70B时,Meta仍禁止开发者使用该模型训练其他生成式模型。而此次发布在新的开源协议中,Meta已不再禁止用新模型来改进其他模型了。
就在Meta推出新模型的同时,英伟达也宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与同样刚推出的Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。据悉,借助NVIDIA AI Foundry,企业和各国现在能够使用Llama 3.1以及NVIDIA软件、计算和专业知识,为其特定领域的行业用例创建自定义“超级模型”。
在发布产品的同时,扎克伯格还发布了一封名为《开源人工智能是前进之路》的公开信。扎克伯格以早期Linux(操作系统内核)的发展历程为例。他提出,在高性能计算的早期,当时各大科技公司都投入巨资开发自己的闭源版Unix,当时还很难想象还有任何其他方法可以开发出如此先进的软件。但最终开源Linux流行了起来——最初是因为它允许开发人员随意修改代码,而且价格更实惠,而随着时间的推移它变得更加先进、更加安全,并且拥有比任何闭源Unix都支持更多功能的更广泛的生态系统。如今,Linux是云计算和运行大多数移动设备的操作系统的行业标准基础。
扎克伯格表示,他相信人工智能也会以类似的方式发展。“今天,几家科技公司正在开发领先的闭源模型,但开源正在迅速缩小差距。去年,我们发布的Llama 2仅与落后的上一代模型相当。而到了今年,Llama 3已经能与最先进的模型相媲美,并在某些领域处于领先地位。从明年开始,我们预计未来的Llama模型将成为业内最先进的模型。”
正在进一步研发Llama 3的图像、视频和语音功能
谈及为什么开源对于开发人员更有利,扎克伯格列举了一些自己在调研过程中观察到的现象:对于世界各地的开发商、CEO和政府官员而言,他们既需要训练、微调和提炼自己的模型;也需要对模型有一定的掌控权,不希望被一家封闭供应商所束缚。同时也期待能保护自己的数据,不想通过把数据云API发送到闭源模型中;更期待能投资于将成为长期标准的生态系统,而不少人认为开源模型的发展速度比闭源模型发展更快。
扎克伯格还谈到,对于Meta来说,选择开源模式也更有利于Meta达到继续为用户打造最佳体验的愿景。而对于开源是否会使得Llama系列大模型失去技术优势的问题,扎克伯格则从生态系统的开放完整性、Meta在大模型上的商业化路径等方面给出了答复。
“首先,为了确保我们能够使用最好的技术、不会长期被困在封闭的生态系统中,Llama需要发展成为一个完整的生态系统,包括工具、效率改进、芯片优化和其他集成。如果我们是唯一使用 Llama的公司,那么这个生态系统就不会发展。其次,我预计人工智能开发将继续保持高度竞争,这意味着开源任何给定模型并不会失去当时相对于下一个最佳模型的巨大优势。Llama成为行业标准的道路是一代又一代地保持竞争力、高效和开放;第三,Meta 与闭源模型提供商之间的一个关键区别是,出售AI模型访问权限不是我们的商业模式。这意味着公开发布Llama不会像闭源提供商那样削弱我们的收入、可持续性或投资研究的能力,这也是一些封闭提供商不断游说政府反对开源的原因之一。”
Llama内部科学家@astonzhangAZ也在社交平台上透露,研究团队目前正在考虑将图像、视频和语音功能集成到Llama 3之中,使得模型能够识别图像和视频并支持通过语音进行交互。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- OpenAI放大招!发布最强水平大模型 解决博士生级别科学问题
- Meta发布新MR头显,预告“史上最强”AR眼镜,黄仁勋点赞
- 重磅!苹果正式上线Apple Intelligence 还发布配置最强M4芯片的iMac
- DeepMind开源生物分子预测模型 诺奖成果将掀起AI制药浪潮?
- 开源证券:小鹏汽以ADAS技术立身 造车卖车综合实力提升
- 阿里通义千问代码模型Qwen2.5-Coder全系列正式开源
- 小鹏汽车史上最强季报:只能跟自己比
- 小鹏汽车发布“史上最强财报”:MONA M03、P7+立功?
- 阿里巴巴CEO吴泳铭:AI发展需要一批不同规模、不同领域的开源大模型
- “史上最强”指引!李斌回应盈利
-
11月19日消息,三菱日联金融集团董事长Kanetsugu Mike表示,到2026年3月日本央行可能将政策利率提高至1%的“中性利率”水平。他表示,这是三菱日联金融集团的内部观点。(彭博) ...
- sam128
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
- caffycat
- 2 小时前
- 支持
- 反对
- 回复
- 收藏
-
每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
- star8699
- 前天 19:48
- 支持
- 反对
- 回复
- 收藏
-
上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
- goodfriendboy
- 前天 20:09
- 支持
- 反对
- 回复
- 收藏