すべての相手を轢き潰す?グーグルが軽量化オープンソースの大モデルを発表、ノートパソコンが走れる
什么大师特
发表于 2024-2-22 13:16:02
208
0
0
オープンソースの大モデルコースは重量ポンドの新製品を迎えている。
グーグルは現地時間2月21日、開発者や研究者が責任を持って人工知能を構築するための新しいオープンソース大言語モデル(LLM)「Gemma」を正式に発表した。
紹介によると、Gemmaの大モデルはグーグル最大規模で最も能力の高い人工知能モデルGeminiと技術とインフラストラクチャを共有しており、「Geminiに触発され、Google DeepMindとGoogleの他のチームは協力してGemmaを開発し、ラテン語で『宝石』を意味するgemmaを命名した」という。
しかしGeminiよりもGemmaの方が軽量化されている。同時に、Gemmaは無料で使用されており、モデルの重みもオープンソースになっており、商用化が可能です。
グーグルは、Gemma 2 B(20億パラメータ)とGemma 7 B(70億パラメータ)の2つの異なる重み規模のモデルを発表した。各規模には事前トレーニングと命令微調整バージョンがあり、すべての組織が責任を持ってビジネスと配布を行うことができます。
グーグルがGemmaを発表した同日、台頭するチップメーカーの英偉達也氏は、グーグルと協力し、Gemmaモデルがチップ上で順調に動作するように確保したと発表した。英偉達氏はまた、傘下のチャットロボットソフトウェアChat With RTXもすぐにGemmaに対応すると述べた。
注目すべきは、グーグルはまた、Gemmaが重要な基準を越えてより大きなモデルを轢くことができることを強調している。さらに印象的なのは、グーグルのGemmaがノートパソコンで動作できることだ。
グーグル側によると、Geminiは現在広く使われている最大で最も強力なAIモデルだという。他のオープンモデルと比べて、Gemma 2 Bと7 Bはその範囲内で同類の最適な性能を実現することができます。Gemmaモデルは開発者のノートパソコンやデスクトップパソコン上で直接動作することができ、「重要なベンチマークではより大きなモデルを超えており、安全で責任ある出力の厳しい基準を遵守していることに注目してください」と述べています。
オープンソースモデルと同時に、GoogleはGemmaのパフォーマンス、データセット構成、モデリング方法の詳細に関する技術報告書を発表した。ある研究者は技術報告書で、Gemmaがサポートしている用語集のサイズが256 Kに達していることを発見した。これは、英語以外の言語に対してより良く、より迅速なサポートを提供できることを意味している。
GemmaとMeta社が発表したLlama 2のパラメータを比較すると、グーグルの公式サイトから
Gemmaも最初に有名なオープンソースモデルライブラリHuggingFaceとHuggingChatにオンラインになりました。オンラインになって間もなく、HuggingFaceの「大言語モデルランキング」で、Gemma 2 Bと7 Bモデルがダブルランクインした。
AI業界の専門家であり、ディープラーニングフレームワークKerasの著者であるFranois Cholet氏は、最強のオープンソース大モデルの位置が今では変わりつつあると述べた。
GemmaのライバルであるLlama 3も発表を控えている。Meta共同創業者兼最高経営責任者のザッカーバーグ氏は1月19日、MetaがLlama 3を訓練しており、責任ある方法でオープンソースを継続すると発表した。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- オープンソースではなくGemmaを開放グーグルはなぜ大モデル競争戦略を転換したのか。
- 阿里雲魔搭が「ModelScope-Soraオープンソース計画」を開始
- Metaはオープンソースの大モデルLLaMA 3が来月登場することを確認し、年末には60万個のH 100 GPUに相当する「スーパーコンピューティングパワーライブラリ」も建設する予定です|大模界
- オープンソースコミュニティ分水嶺:Meta大モデルLlama 3の発表パラメータは最高または4000億に達する
- Metaが最強のオープンソースモデルLlama 3.1を発表、ザッカーバーグ氏:業界の転換点になる
- Metaが“業界トップ”のオープンソース人工知能(AI)モデルLlama 3.1を発表
- MetaがオープンソースのビッグモデルLlama 3.1を強力にリリースしてアシストした
- Metaが最強オープンソースAIモデル対標GPT 4-o、Claude 3.5 Sonnet!英偉達代工加持ザッカーバーグ:業界トップレベル
- 阿里通義千問コードモデルQwen 2.5-Coder全シリーズ正式オープンソース
- アリババの呉泳銘CEO:AIの発展には異なる規模、異なる分野のオープンソースの大モデルが必要だ
-
知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
- caffycat
- 8 小时前
- 支持
- 反对
- 回复
- 收藏
-
每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
- star8699
- 前天 19:48
- 支持
- 反对
- 回复
- 收藏
-
上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
- goodfriendboy
- 前天 20:09
- 支持
- 反对
- 回复
- 收藏
-
人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
- 3233340
- 2 小时前
- 支持
- 反对
- 回复
- 收藏