首页 报纸 正文

アリ手を出せ!「世界の底値を打ち破る」

人民宫射好宰
1372 0 0

5月21日に阿里雲氏によると、通義千問GPT-4級主力モデルQwen-Longは、API入力価格を0.02元/千tokensから0.0005元/千tokensに下げ、97%下落した。これは、1元で200万tokensを買うことができ、5冊の「新華字典」の文字量に相当することを意味している。このモデルは最大1千万tokensの長テキスト入力に対応し、値下げ後はGPT-4価格の約400分の1になる。
21日に行われた武漢AIリーダーサミットの現場で、阿里雲知能グループのベテラン副総裁で公共クラウド事業部の劉偉光総裁は、「中国最大のクラウドコンピューティング会社として、阿里雲が今回大きなモデルの推理価格を大幅に引き下げたのは、AI応用の爆発を加速させたいということだ。将来的には、大モデルAPIの呼び出し量が何千何万倍も増加すると予想される」と述べた。
劉偉光氏は、今回のアリ通義千問の新たな変化を「世界的な底値を打ち破り、AI爆発を加速させる」と形容した。
値下げは9種類の商業化とオープンソースシリーズモデルをカバーする
今回の通義千問値下げは、Qwen-Long、Qwen-Max、Qwen 1.5-72 Bなど9種類の商業化とオープンソースシリーズモデルをカバーしているという。そのうち、通義千問主力モデルQwen-Longは、文脈長が最高1000万に達し、API入力価格は0.02元/千tokensから0.0005元/千tokensに下げ、下げ幅は97%に達した、発表されたばかりのフラッグシップモデルQwen-Maxは、権威あるベンチマークOpenCompass上でGPT-4-Turboの性能を向上させ、そのAPI入力価格は0.04元/千tokensに下げ、67%下落した。
その中で、主力モデルQwen-Long性能対称GPT-4級は、超長コンテキストシーンを処理でき、中国語、英語などの異なる言語入力をサポートし、最長1000万tokens(約1500万字または1.5万ページの文書)の超長コンテキスト対話をサポートする。阿里雲百錬プラットフォームと同時にオンライン化された文書サービスに合わせて、ワード、pdf、markdown、epub、mobiなどの多種の文書フォーマットの解析と対話をサポートすることができる。
パブリッククラウド+APIは、大規模モデルを使用する企業の主流となる
大モデルの性能が徐々に向上するにつれて、AI応用革新は密集探索期に入っているが、推理コストが高すぎることは依然として大モデルの規模化応用を制約する重要な要素である。
プライベート化された導入とは異なり、クラウド上での呼び出しに基づいて、大モデルの「コスト削減の効果」により大きな空間を提供しています。一般的に、私有化配置のオープンソースモデルは独自にクラスタを構築する必要があり、ハードウェア購入、ソフトウェア配置、ネットワーク費用、電気料金、およびハードウェア減価償却、人力などの多重コスト要素を考慮しなければならず、計算資源の遊休や過負荷などの状況が発生した場合、追加のコストを支払う必要がある。クラウド上で大モデルAPIを呼び出すことで、必要に応じて使用することができます。
劉偉光氏は、今回のアリ通義千問の新たな変化を「世界的な底値を打ち破り、AI爆発を加速させる」と形容した。
オープンソースモデルであれビジネスモデルであれ、パブリッククラウド+APIが企業が大モデルを使用する主流の方法になるには、主に3つの理由があると述べた。
まず、パブリッククラウドの技術的配当と規模効果は、巨大なコストとパフォーマンスの優位性をもたらします。阿里雲はモデル自身とAIインフラストラクチャの2つのレベルから絶えず最適化し、究極の推論コストと性能を追求することができる。阿里雲は自己研究の異種チップ相互接続、高性能ネットワークHPN 7.0、高性能ストレージCPFS、人工知能プラットフォームPAIなどの核心技術と製品に基づいて、極限弾力性のAI計算力スケジューリングシステムを構築し、百錬分散式推論加速エンジンと結合して、モデル推論コストを大幅に圧縮し、モデル推論速度を加速した。
つまり、同じオープンソースモデルであっても、パブリッククラウド上の呼び出し価格は、プライベート化導入よりもはるかに低い。Qwen-72 Bオープンソースモデルを使用し、毎月1億tokensの使用量を例に、阿里雲百錬でAPIを直接呼び出すには毎月600元しかかからず、私有化配置のコストは平均して毎月1万元を超えている。
2つ目は、クラウド上でのマルチモデル呼び出しがより便利になり、エンタープライズクラスのデータセキュリティを提供することです。アリクラウドは企業ごとに専用VPC環境を提供することができ、計算隔離、記憶隔離、ネットワーク隔離、データ暗号化を実現し、データの安全を十分に保障することができる。現在、アリ雲はすでに10以上の大モデルの安全に関する国際国内技術基準の制定を主導しているか、深く参加している。
第三に、クラウドメーカーの天然の開放性であり、開発者に最も豊富なモデルとツールチェーンを提供することができる。阿里雲百錬プラットフォームには通義、百川、ChatGLM、Llamaシリーズなど百種類以上の国内外の良質なモデルが集結し、大モデルのカスタマイズと応用開発ツールチェーンを内蔵し、開発者は異なるモデルを容易にテスト比較し、専属の大モデルを開発し、RAGなどの応用を容易に構築することができる。モデルの選択、モデルの調整、組み合わせから対外サービスまで、ワンストップで行うことができます。
最新のデータによると、通義大モデルはアリクラウドサービス企業を通じて9万社を超え、釘付けサービス企業を通じて220万社を超え、PC、携帯電話、自動車、航空、天文、鉱業、教育、医療、飲食、ゲーム、文旅などの分野で定着している。
5月9日、小米傘下の人工知能アシスタント「愛ちゃん学友」はすでに阿里雲通義大模型と協力し、画像生成、画像理解などの面での多モードAI生成能力を強化し、小米自動車、携帯電話などの多種類の設備に着地した。また、マイクロブログ、衆安保険、パーフェクトワールドゲームなどの企業も、ソーシャルメディア、保険、ゲームなどの分野に大モデルを応用するための通義大モデルへのアクセスを発表した。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
    caffycat
    昨天 11:18
    支持
    反对
    回复
    收藏
  •   每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
    star8699
    3 天前
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
    goodfriendboy
    3 天前
    支持
    反对
    回复
    收藏
  •   人民网北京11月22日电 (记者栗翘楚、任妍)2024广州车展,在新能源汽车占据“半壁江山”的同时,正加速向智能网联新能源汽车全面过渡,随着“端到端”成为新宠,智能驾驶解决方案成为本届广州车展各大车企竞 ...
    3233340
    昨天 17:06
    支持
    反对
    回复
    收藏
人民宫射好宰 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2