首页 报纸 正文

Metaが最強のオープンソースモデルLlama 3.1を発表、ザッカーバーグ氏:業界の転換点になる

SNT
209 0 0

北京時間7月23日夜、Metaは最新のオープンソース大モデルLlama 3.1シリーズを正式に発表し、オープンソースモデルとクローズソースモデルの差をさらに縮小した。Llama 3.1は8 B、70 B、450 Bの3つのパラメータ規模を含み、そのうち450 Bパラメータのモデルは複数のベンチマークテストでOpenAIのGPT-4 oを上回り、Claude 3.5 Sonnetなどの先行するクローズドソースモデルに匹敵する。
Meta創業者のザッカーバーグCEOは同日、公式サイトにブログを掲載し、今回の発表を後押しした。同氏によると、Llama 3.1バージョンは業界の転換点となり、多くの開発者が主にオープンソースを使用し始め、オープンソースAIは将来の発展方向だという。
XでMetaチームを祝った英偉達高級研究科学者ジム・ファン氏は、「GPT-4の力は私たちの手にあり、本当に歴史的な瞬間だ」と述べた。
具体的な詳細については、Llama 3.1の3つのバージョンのモデルコンテキストウィンドウはすべて8 kから128 Kに増加し、16倍に拡大し、8つの言語をサポートしています。その中で、Llama 3.1-405 Bモデルは15兆個を超えるtokensを使用して訓練を行い、そしてこの訓練規模を達成するために、チームは1.6万個のH 100のGPUを使用した。公式によると、405 Bモデルはこの規模で訓練された最初のLlamaモデルだという。
オープンソースの大規模な言語モデルは機能と性能の面でクローズソースモデルに遅れていることが多いが、「しかし今、オープンソースがリードする新しい時代を迎えている」。
公式ブログでは、Metaは150を超えるベンチマークデータセットの性能を評価し、Llama 3.1と他のモデルの能力表現を比較し、旗艦モデルLlama 3.1-405 Bは常識、操作性、数学などの一連のタスクの中でGPT-4、GPT-4 o、Claude 3.5 Sonnetに匹敵することができる。また、8 Bと70 Bの小型モデルは、同じ数のパラメータを持つ閉源と開源モデルと競争力がある。
現実のシナリオでは、Llama 3.1 405 Bは、GPT−4 oおよびClaude 3.5 Sonnetよりも全体的に優れたパフォーマンスを有する人工評価と比較した。
今回のMetaはまた、開発者が初めてLlamaモデル(405 Bを含む)の出力を使用して他のモデルを改良できるようにオープンソースライセンスを更新した。GPT-4 oに対しては、モデルが画像とビデオを認識し、音声でインタラクションをサポートするために、画像、ビデオ、音声機能を組み合わせてLlama 3に統合することもあると公式に述べています。しかし、現在も開発中であり、リリースの準備はできていない。
公式ブログでMetaは、これまでのすべてのLlamaバージョンの総ダウンロード数が3億回を超えていることを明らかにした。
今回のモデル発表のほか、ザッカーバーグ氏は公式サイトで長文「Open Source AI Is the Path Forward」を発表し、その中でオープンソースの重要性に言及し、オープンソースはすべての開発者にとって、メッタにとって、そして世界にとって良いことだと考えている。
ザッカーバーグ氏は、オープンソース系Linuxがクローズドソース系Unixに勝ったことを例に、人工知能が同様の方法で発展すると考えている。「いくつかの科学技術会社が先行する閉鎖モデルを開発しているが、オープンソースは急速に差を縮めている」と同氏は述べ、昨年、Llama 2は旧世代モデルとしか比較できなかったと述べた。今年、Llama 3はいくつかの分野で競争力を持ち、いくつかの面で最先端のモデルをリードしている。
ザッカーバーグ氏は、オープンソースは革新を促進し、コストを削減し、安全性を高めることができると考えている。開発者にとっては、オープンソースを使用することで独自のモデルを訓練、微調整、蒸留することができ、各組織には異なるニーズがあり、これらのニーズを満たすために異なるサイズのモデルを使用することが好ましいが、これらのモデルは特定のデータによって訓練または微調整されている。
同時に、開発者は閉鎖されたベンダーにロックされず、データセキュリティを保護することができます。「オープンソースソフトウェアは、開発がより透明で、広くレビューされるため、より安全であることが多い」とザッカーバーグ氏は見ている。
ザッカーバーグ氏はまた、オープンソースモデルのコストはより低く、効率的であり、開発者はGPT-4 oのような閉鎖モデルの約50%を使用して、ユーザーインタフェースとオフライン推論に適しているLlama 3.1 405 B上の推論を彼ら自身のインフラストラクチャ上で実行することができると述べた。
「オープンソース人工知能は世界最高の機会を意味する」とザッカーバーグ氏は見ている。この技術を利用することで、最大の経済的機会と安全保障を創出することができる。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
    caffycat
    7 小时前
    支持
    反对
    回复
    收藏
  •   每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
    star8699
    前天 19:48
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
    goodfriendboy
    前天 20:09
    支持
    反对
    回复
    收藏
  •   人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
    3233340
    2 小时前
    支持
    反对
    回复
    收藏
SNT 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    34