バイト、アリが再び価格戦をめくる百度が続く！大きな模型が「白菜価格」を売る図は何ですか。

ビッグモデルの価格戦は狂ったように戦った。
5月21日午前、阿里雲は通義千問GPT-4級主力モデルQwen-Longを97%値下げし、1元で200万tokensを購入できると発表した。
この動きはバイトを指す剣の味がある。これに先立ち、バイト鼓動は5月15日に豆包大モデルを発表し、主力モデルの市場価格は0.0008元/千tokensで、業界平均価格より99.3%安いと発表した。アリクラウドが値下げされると、API入力価格は0.02元/千tokens（テキスト単位）から0.0005元/千tokensに下がった。
しかし、97%の値下げにもかかわらず、阿里雲の価格優位性は数時間しか維持されていない。21日午後、百度スマートクラウドは文心大モデルの2大主力モデルを全面無料にし、ERNIE SpeedとERNIE Liteを含む即時発効を発表した。
「1社でも値下げをしなければならないが、そうでなければ落伍するだろう」と、大手モデルメーカーの最近の値下げについて、新浪微博新技術研究開発責任者の張俊林氏は第一財経記者に語った。激高して悲惨な価格戦の背後には、大手モデルメーカーがついていかなければならない理由がたくさんある。
大模型が値下げの波を巻き起こす
実際、この大型モデルの値下げブームは5月から始まった。
5月6日、幻方量子化傘下のDeepSeek（深さ求索）は第2世代MoE（専門家モデル）DeepSeek-V 2を発表し、API（インタフェース）は百万tokens当たり1元、出力2元（32 Kコンテキスト）を価格設定し、GPT-4-Turboのほぼ1%を価格設定した。
5月13日、智譜大モデルオープンプラットフォームは新しい価格体系をラインアップし、入門級製品GLM-3ターボモデルの呼出価格を80%引き下げ、1元/百万tokensとした。その後、OpenAIはGPT-4 oを発売し、価格はGPT-4 Turboの半分で、入力、出力は百万tokensあたり5ドル、15ドルだった。バイト豆パックの大モデルが値下げの波に加わった。
阿里雲の4つの通義千問商業化モデルと3つの通義千問開源モデルの異なる程度の値下げと文心大モデルの2つの主力モデルの全面的な無料化に伴い、大モデルメーカーは自分の利益空間を「搾取」しているようだ。
なぜ大きなモデルがこんなに大幅に値下げできるのか。これについて、アリクラウド側は、これは主にパブリッククラウドの技術的配当とスケール効果によるコストとパフォーマンスの優位性によるものだと述べています。モデルとAIインフラの2つのレベルで最適化されています。
Canalysクラウドアナリストの章一氏は第一財経記者に対し、「中国の顧客層は実は価格に特に敏感で、大モデルメーカーの値下げは、より多くの顧客が大モデルを使用するように誘致するためだ」と述べた。同時に、多くの値下げした大モデルメーカーもクラウドメーカーであり、クラウドメーカーが大モデルを値下げさせる最も本質的な目的はやはりクラウド消費を牽引することである。
底値を絶えず叩き、無料にする「急進的」戦略の下で、大手モデルメーカーの「陣地奪取」の決意は短期利益への渇望をはるかに上回っている。章一分析によると、中国メーカー自身が商売をするのに得意な手段は低価格で市場に参入し、量を歩くことでコストを広げることだ。現在、中国Bエンド市場で実際にAIを使用している顧客の割合は高くなく、値下げにより、大モデルメーカーはその大モデルを使用する敷居を下げたいと考えている。
5月21日、阿里雲が通義千問GPT-4級主力モデルの値下げを発表したことに対し、バイト鼓動火山エンジンの担当者は第一財経記者に対し、通義千問大モデルの値下げを非常に歓迎し、共同で企業がより低コストでAIのモデルチェンジを模索し、大モデルの応用シーンの着地を加速させることを支援したと述べた。
値下げだけでは足りない
大モデルの値下げの背後には、その背後にある計算力コストの下落も業界トレンドであることが注目されている。
阿里雲氏によると、弾力性のあるAI計算力スケジューリングシステムと、百錬分割式推論加速エンジンを組み合わせて、阿里雲は大規模推論クラスターを最適化し、モデル推論コストを大幅に圧縮し、推論速度を加速させた。
テンセントクラウドは最近、大モデルの計算力コストの低下についても言及した。テンセントグループの姜傑副総裁は、ローエンドカードの計算力が低く、グラフィックメモリが小さい不足に対して、テンセントは自己研究Angel訓練推論プラットフォームを使用して、異種カードクラスタをスケジューリングし、兆大モデル推論コストはオープンソースより70%減少したと明らかにした。
火山エンジンの譚待総裁はこれまで、バイトはモデル構造を最適化し、単機推論を分散推論に変更し、混合スケジューリングクラウドの計算力などを通じてコストを削減すると述べてきた。DeepSeekの担当者は、DeepSeek-V 2がコストと効果を両立するのは基本的にモデル構造の革新に頼っていると理解している。
しかし、値下げに加えて、大きなモデル分野にはもっと新しい物語が必要だ。
阿里雲知能グループのベテラン副総裁で公共クラウド事業部の劉偉光総裁は今日、大型モデルの値下げの業界動向を取り上げた際、価格戦は市場の基本原則に従い、値下げは必ず市場に恩恵を与え、市場の発展を推進することを目標にし、「流動量博のギャグではない」と述べた。
どのような企業が値下げで市場を優遇し、市場の発展を推進することができますか。劉偉光氏は4つの原則に言及した：まず、市場に恩恵を与えるには、モデルのベースモデル能力が十分にリードしなければならない、次に、モデルに本当の推理資源があるかどうかを見なければならない。その3、現在のモデルは多くのお客様が使用しており、ビジネス価値を生み出すことができるのではないでしょうか。最後に、大きなモデルはこの会社の主要な業務ではなく、企業に戦略的な定力があるかどうか。
ビッグモデルの価格戦をどのように見ているのか、テンセントが値下げするのかについて、テンセント雲副総裁、テンセント雲知能責任者の呉運生氏はこのほどインタビューで直接応じなかった。「私たちはここ数日、業界の状況にも注目しています。実は私たちは底層の大モデルの能力を高め、ユーザーを本当に使うことに集中しています」と呉運生氏は第一財経などのメディアに語った。
「最後の1キロ」の問題はまだ大きな模型の前に横たわっている。章一分析によると、大モデルの値下げブームは短期的に一部の顧客を引き付ける可能性があるが、長期的には、より多くのユーザーを引き付けるには、大モデルはどのようにしてより多くの着地価値を生み出すかという問題に直面している。
ビッグモデルはお客様の実際のビジネスにどのような価値をもたらすのでしょうか。AIの生産力は顧客に実際の過程でコストを下げ、企業の効率と実際の利益を高めることができるかどうか、これこそ顧客にとって別のレベルでのコスト削減であり、大モデルの商業化の落地過程における重要な問題でもある。国内でも海外でも、大きなモデルが着地して価値を生む物語はまだ十分ではない。

OpenAI“下一个重大突破” 首个AI助理产品或明年1月发布人机交互变革已至？

小摩辣评“特朗普2.0”：关税大棒料打击经济、重燃通胀！

在线音乐付费用户达1.19亿腾讯音乐2024年第三季度持续高质量增长

英伟达和软银试运行全球首个人工智能和5G电信网络

バイト、アリが再び価格戦をめくる百度が続く！大きな模型が「白菜価格」を売る図は何ですか。

OpenAI“下一个重大突破” 首个AI助理产品或明年1月发布 人机交互变革已至？

小摩辣评“特朗普2.0”：关税大棒料打击经济、重燃通胀！

在线音乐付费用户达1.19亿 腾讯音乐2024年第三季度持续高质量增长

英伟达和软银试运行全球首个人工智能和5G电信网络

OpenAI“下一个重大突破” 首个AI助理产品或明年1月发布人机交互变革已至？

在线音乐付费用户达1.19亿腾讯音乐2024年第三季度持续高质量增长