首页 报纸 正文

Metaが発表した「最強オープンソース大モデル」オープンソースとクローズソースの争い新しいページの大モデルを開くか、シャッフルを迎える

愿为素心人
197 0 0

Metaは現地時間7月23日、最新バージョンの言語大モデルLlama 3.1を正式に発表した。今回の発表はAIコミュニティから「オープンソース後進論」への強力な反撃とされ、Meta創業者でCEOのザッカーバーグ氏も発表時に「オープンソースAIは未来への道だ」と述べた。
従来、OpenAIはChatGPTの閉鎖性のため、「Open」と呼ばれているが実際には「Close」のことをしていると非難されてきたが、ChatGPT-4 oに代表される閉源大モデルの実力は業界を退却させることが多く、「閉源大モデルの性能は必ず開源大モデルより強い」という考えがデフォルトになっているようだ。
しかし、今回のLlama 3.1のリリースはこの構造を上書きするようだ。今回のMetaは、8 B、70 B、405 BのLlama 3.1の3つのバージョンをリリースしました。このうち405 Bは「トップフィット」バージョンで、Metaは最高の閉源モデルに匹敵する性能を誇ると言われています。
「最強オープンソース大モデル」
Llama 3.1 405 Bはなぜ最高の閉源モデルと競争できるのか。Llama 3.1を発表すると同時に、Metaも「The Llama 3 Herd of Models」と題する論文を発表し、その中でLlama 3モデルの研究開発の詳細を詳しく述べた。
まず、使用上、Llama 3.1は8つの言語をサポートし、3つのバージョンのコンテキストウィンドウはGPT-4 Turboと同じ128 Kに拡張されています。同時に、Llama 3.1 405 Bは4050億個のモデルパラメータを持ち、訓練規模はLlama 2の50倍であり、より安定した性能を維持するために密集Transformerアーキテクチャを採用している。これにより、Llamaが一度に処理できるテキストの数は9.6万字に達し、同時に長いテキストでも短いテキストでも、「思い通りに」処理することができる。
論文では、MetaもLlama 3.1 405 BとChatGPT-4 oとClaude 3.5 Sonnetのこれらの頭部閉源大モデルの性能比較データを発表した。テストの結果、Llama 3.1 405 Bは汎用性能、長テキスト処理、多言語処理の多方面で得点がリードしていることが分かった。例えば、ZeroSCROLLSプロジェクトのテストでは、Llama 3.1 405 Bのスコアは95.2で、後の両方は90.5です。
優れた性能と膨大な訓練基数を表現することで、Llama 3.1は「最強オープンソース大モデル」の称号を持つようになったが、現在のLlama 3.1は依然として言語処理を主とする大モデルであり、画像、ビデオ、音声の処理をサポートしていない。これは、多モードタスク処理において、ChatGPTが依然として際立った能力を持っていることを意味する。
「オープンソースAIは未来の道」
Llamaの実際の使用体験はまだ完璧なほどではないかもしれないが、今回のLlama 3.1 405 Bの発表は、世界中のAIワーカーにとって最大の意味はやはり大モデルのオープンソースとクローズソースの争いが新たなページを開いたことにある。
メッタの公式サイトでザッカーバーグ氏は公開書簡を発表し、「オープンソースAIは未来への道だ」と力強く宣言した。同書によると、複数の企業が先行するクローズドソースモデルを開発しているにもかかわらず、オープンソースは急速に差を縮めているという。Llamaを例にとると、昨年のLlama 2は汎用大モデルの古いバージョンにしか匹敵できなかったが、今年のLlama 3は最先端の大モデルと競争し、一部の分野でリードしている。
そのため、ザッカーバーグ氏はLlamaを大モデル時代のLinuxにして、オープンソースAIの業界標準にしたいと考えている。「高性能コンピューティングの初期には、主要技術会社が独自のクローズドソースUnixバージョンの開発に巨額を投じていました……今日、オープンソースのLinuxはクラウドコンピューティングとモバイルデバイスのほとんどを実行するオペレーティングシステムの工業標準的な基礎となり、人工知能は同様の方法で発展すると信じています」
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
    caffycat
    8 小时前
    支持
    反对
    回复
    收藏
  •   每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
    star8699
    前天 19:48
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
    goodfriendboy
    前天 20:09
    支持
    反对
    回复
    收藏
  •   人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
    3233340
    2 小时前
    支持
    反对
    回复
    收藏
愿为素心人 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    33