アリ手を出せ!「世界の底値を打ち破る」
人民宫射好宰
发表于 2024-5-21 15:56:06
1315
0
0
5月21日に阿里雲氏によると、通義千問GPT-4級主力モデルQwen-Longは、API入力価格を0.02元/千tokensから0.0005元/千tokensに下げ、97%下落した。これは、1元で200万tokensを買うことができ、5冊の「新華字典」の文字量に相当することを意味している。このモデルは最大1千万tokensの長テキスト入力に対応し、値下げ後はGPT-4価格の約400分の1になる。
21日に行われた武漢AIリーダーサミットの現場で、阿里雲知能グループのベテラン副総裁で公共クラウド事業部の劉偉光総裁は、「中国最大のクラウドコンピューティング会社として、阿里雲が今回大きなモデルの推理価格を大幅に引き下げたのは、AI応用の爆発を加速させたいということだ。将来的には、大モデルAPIの呼び出し量が何千何万倍も増加すると予想される」と述べた。
劉偉光氏は、今回のアリ通義千問の新たな変化を「世界的な底値を打ち破り、AI爆発を加速させる」と形容した。
値下げは9種類の商業化とオープンソースシリーズモデルをカバーする
今回の通義千問値下げは、Qwen-Long、Qwen-Max、Qwen 1.5-72 Bなど9種類の商業化とオープンソースシリーズモデルをカバーしているという。そのうち、通義千問主力モデルQwen-Longは、文脈長が最高1000万に達し、API入力価格は0.02元/千tokensから0.0005元/千tokensに下げ、下げ幅は97%に達した、発表されたばかりのフラッグシップモデルQwen-Maxは、権威あるベンチマークOpenCompass上でGPT-4-Turboの性能を向上させ、そのAPI入力価格は0.04元/千tokensに下げ、67%下落した。
その中で、主力モデルQwen-Long性能対称GPT-4級は、超長コンテキストシーンを処理でき、中国語、英語などの異なる言語入力をサポートし、最長1000万tokens(約1500万字または1.5万ページの文書)の超長コンテキスト対話をサポートする。阿里雲百錬プラットフォームと同時にオンライン化された文書サービスに合わせて、ワード、pdf、markdown、epub、mobiなどの多種の文書フォーマットの解析と対話をサポートすることができる。
パブリッククラウド+APIは、大規模モデルを使用する企業の主流となる
大モデルの性能が徐々に向上するにつれて、AI応用革新は密集探索期に入っているが、推理コストが高すぎることは依然として大モデルの規模化応用を制約する重要な要素である。
プライベート化された導入とは異なり、クラウド上での呼び出しに基づいて、大モデルの「コスト削減の効果」により大きな空間を提供しています。一般的に、私有化配置のオープンソースモデルは独自にクラスタを構築する必要があり、ハードウェア購入、ソフトウェア配置、ネットワーク費用、電気料金、およびハードウェア減価償却、人力などの多重コスト要素を考慮しなければならず、計算資源の遊休や過負荷などの状況が発生した場合、追加のコストを支払う必要がある。クラウド上で大モデルAPIを呼び出すことで、必要に応じて使用することができます。
劉偉光氏は、今回のアリ通義千問の新たな変化を「世界的な底値を打ち破り、AI爆発を加速させる」と形容した。
オープンソースモデルであれビジネスモデルであれ、パブリッククラウド+APIが企業が大モデルを使用する主流の方法になるには、主に3つの理由があると述べた。
まず、パブリッククラウドの技術的配当と規模効果は、巨大なコストとパフォーマンスの優位性をもたらします。阿里雲はモデル自身とAIインフラストラクチャの2つのレベルから絶えず最適化し、究極の推論コストと性能を追求することができる。阿里雲は自己研究の異種チップ相互接続、高性能ネットワークHPN 7.0、高性能ストレージCPFS、人工知能プラットフォームPAIなどの核心技術と製品に基づいて、極限弾力性のAI計算力スケジューリングシステムを構築し、百錬分散式推論加速エンジンと結合して、モデル推論コストを大幅に圧縮し、モデル推論速度を加速した。
つまり、同じオープンソースモデルであっても、パブリッククラウド上の呼び出し価格は、プライベート化導入よりもはるかに低い。Qwen-72 Bオープンソースモデルを使用し、毎月1億tokensの使用量を例に、阿里雲百錬でAPIを直接呼び出すには毎月600元しかかからず、私有化配置のコストは平均して毎月1万元を超えている。
2つ目は、クラウド上でのマルチモデル呼び出しがより便利になり、エンタープライズクラスのデータセキュリティを提供することです。アリクラウドは企業ごとに専用VPC環境を提供することができ、計算隔離、記憶隔離、ネットワーク隔離、データ暗号化を実現し、データの安全を十分に保障することができる。現在、アリ雲はすでに10以上の大モデルの安全に関する国際国内技術基準の制定を主導しているか、深く参加している。
第三に、クラウドメーカーの天然の開放性であり、開発者に最も豊富なモデルとツールチェーンを提供することができる。阿里雲百錬プラットフォームには通義、百川、ChatGLM、Llamaシリーズなど百種類以上の国内外の良質なモデルが集結し、大モデルのカスタマイズと応用開発ツールチェーンを内蔵し、開発者は異なるモデルを容易にテスト比較し、専属の大モデルを開発し、RAGなどの応用を容易に構築することができる。モデルの選択、モデルの調整、組み合わせから対外サービスまで、ワンストップで行うことができます。
最新のデータによると、通義大モデルはアリクラウドサービス企業を通じて9万社を超え、釘付けサービス企業を通じて220万社を超え、PC、携帯電話、自動車、航空、天文、鉱業、教育、医療、飲食、ゲーム、文旅などの分野で定着している。
5月9日、小米傘下の人工知能アシスタント「愛ちゃん学友」はすでに阿里雲通義大模型と協力し、画像生成、画像理解などの面での多モードAI生成能力を強化し、小米自動車、携帯電話などの多種類の設備に着地した。また、マイクロブログ、衆安保険、パーフェクトワールドゲームなどの企業も、ソーシャルメディア、保険、ゲームなどの分野に大モデルを応用するための通義大モデルへのアクセスを発表した。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
猜你喜欢
- アリ投資ロボット会社の逐次動力
- バイト、アリが再び価格戦をめくる百度が続く!大きな模型が「白菜価格」を売る図は何ですか。
- 必死に戦っても市場価値が再びアリを上回った
- アリ氏が月へのダークサイド投資の詳細を発表:8億ドルで約36%の株式を購入
- アリ年報が発表した変革1年の成績表:コア業務が再び健全成長軌道に戻るAI駆動の見通しは広大
- 宝尊電子商取引はアリ清倉に応答:投資戦略調整後の正常な取引行為
- アリ清倉に遭遇!宝尊電子商取引の対応:投資戦略調整後の正常な取引行為を理解する
- 時価総額世界一なのに「空を見る」ことが絶えない?段永平も手を出す
- ヘッドサーバメーカーがアリAIチップのOEMを受注
- ニュースによると、アリが入局したステップスター辰の新たな融資
-
当地时间周五(6月28日),旧金山联储主席戴利表示,最新通胀数据显示货币政策正在发挥作用,但现在判断何时适合降息还为时过早。 戴利指的是个人消费支出(PCE)价格指数,核心PCE是美联储偏爱的通胀指标 ...
- kobechan
- 前天 10:21
- 支持
- 反对
- 回复
- 收藏
-
央视新闻消息,美国国家航空航天局27日宣布,将与波音公司一道,继续对波音“星际客机”飞船推进系统出现的问题进行研究。美东时间28日下午,他们还将就“星际客机”的最新情况举行新闻发布会。因技术问题,波音 ...
- yxtianyouyou
- 昨天 14:10
- 支持
- 反对
- 回复
- 收藏
-
两名知情人士上周日(6月30日)表示,美国司法部将对波音公司提起刑事诉讼,并就两起致命坠机事件以欺诈罪立案,要求波音认罪或接受审判。 消息人士称,美国司法部计划在当天晚些时候正式向波音公司提出认 ...
- yixin66
- 13 小时前
- 支持
- 反对
- 回复
- 收藏
-
7月1日,特斯拉宣布推出全新购车金融政策。其中,针对Model 3/Y后轮驱动版推出的1~5年0息和低息优惠购车政策,日供低至85元起;针对Model 3/Y长续航全轮驱动版推出的1~5年0息和低息购车优惠政策,日供低至107元 ...
- 覃志辉
- 12 小时前
- 支持
- 反对
- 回复
- 收藏