李彦宏氏は大モデルの「走分」仮象を突き破った：ランキングはすべての実力未来モデルの差が大きくなることを意味しない

新バージョンのビッグモデルが発表されるたびに、業界はサードパーティのランキングデータを引用して、自社のビッグモデルとGPT-4を一緒に&amp ;quot;ランニングポイント&amp ;quot;，いくつかの指標で追い越しを実現したと主張し、自分の大モデルの技術力を証明した。
しかし、最近の百度の李彦宏会長と内部社員の交流で、彼は大模型業界の走分を破った&amp ;quot;障子紙&amp ;quot;。&quot;新しいモデルがリリースされるたびに、GPT-4 oと比較しなければなりません。私の得点はそれとあまり差がないと言っています。一部の単項では得点がそれを超えていますが、これは最先端モデルとの差がないことを示していません。&quot;
彼はさらに、モデル間の差は多次元的であると説明した。1つの次元は能力の面であり、理解能力、生成能力、論理推論能力、記憶能力などの基本的な能力の差であれ、もう1つの次元はコストの面であり、一部のモデルは同じ効果を達成することができるが、コストが高く、推理速度が遅く、実は先進モデルに及ばない。
　　&quot;また、テスト集のover-fittingについては、自分の能力を証明したいモデルごとにランキングをつけています。ランキングを打つときは、誰が何を測っているのか、どの問題が私がどのようなテクニックで正しいのかを当てなければならないので、ランキングやテスト集から見ると、能力はかなり近づいていると思いますが、実際の応用には明らかな差があります。&quot;李彦宏は言った。
ある大手模型業者は記者に、李彦宏氏が言及したテレビ測定集のover-fitting（過フィッティング）とは、主に模型の訓練過程において、模型の訓練データに対する学習が細すぎて、模型の訓練データに対する表現が非常に良いが、見たことのない試験データに劣る現象を指す。これは通常、モデルが複雑すぎて、&amp ;quot;記憶&amp ;quot;トレーニングデータのノイズと詳細は、一般的ではありませんが、これらの詳細とノイズは、モデルをより多くの新しいデータにうまく普及させることはできません。
上記の人は、ランキングの競走点には確かに限界があると考えています。例えば、評価データセットの公開性のため、モデルは的確に訓練して順位を上げることができ、&amp ;quot;ランキングを更新する&amp ;quot;現象は、全く意味がないわけではありませんが、ランキングは相対的に量子化された評価基準を提供し、人々が異なる大モデルの性能を迅速に理解するのを助け、競争を通じて大モデルの技術レベルを絶えず最適化するよう促し、一定の宣伝と普及の役割もあります。
李彦宏から見れば、&amp ;quot;一部の自メディアの宣伝に加えて、新しいモデルが発表されるたびに宣伝の原動力があり、モデル間の能力差が小さくなったという印象を与えているが、実際にはそうではない。&quot;李彦宏氏によると、実際の使用過程では、百度は技術者がランキングを打つことを許さず、本格的に大モデルの能力を測定するのは、具体的な応用シーンの中で、ユーザーのニーズを満たし、価値利得を生むことができるかどうかを見るべきだという。
大モデル業界でよく言われる&amp ;quot;12ヶ月リードしているか、18ヶ月遅れている&amp ;quot;，彼はそれほど重要でもないと思っている。どの会社も完全に競合する市場環境にあり、どの方向に向かっても競合他社が多いからです。&quot;もしあなたが永遠に相手を12 ~ 18ヶ月リードすることを保証できるならば、それは天下無敵で、12 ~ 18ヶ月はとても短い時間だと思わないでください、たとえあなたが永遠にライバルを6ヶ月リードすることを保証することができても、それは勝って、あなたの市場シェアは70%かもしれなくて、相手は20%あるいは10%のシェアだけかもしれません。&quot;
彼は、将来の大モデル間の格差がますます大きくなる可能性があると判断した。大きなモデルは天井が高く、現在では理想的な状況から非常にかけ離れているため、モデルは迅速な反復、更新、アップグレードを続けなければならない。数年、十数年を一日のように投入し、ユーザーのニーズを絶えず満たし、コストを下げて効果を高める必要がある。
大モデル競争にまだ障壁があるかどうかを議論するほか、交流の中で、李彦宏氏はまた、オープンソース閉源モデル効率、AIエージェントなどの話題を含む大モデルに対する外部の誤解がかなり多いことに言及した。
李彦宏は閉源大模型の強固な支持者で、&amp ;quot;大モデル時代までは、オープンソースは無料、低コストを意味することに慣れていました。&quot; オープンソースのLinuxのように、すでにパソコンがあるのでLinuxを使うのは無料だと説明した。しかし、これらは大モデル時代には成立せず、大モデル推論は高価であり、オープンソースモデルも計算力を送ることができず、自分で設備を買わなければならず、計算力の効率的な利用を実現することができなかった。
　　&quot;効率的にオープンソースモデルではいけません。&quot; 彼は、&amp ;quot; 閉源モデルは正確にはビジネスモデルと呼ぶべきで、無数のユーザーが開発コストを分担し、推理用の機械資源とGPUを分担し、GPUの使用効率は最も高く、百度文心大モデル3.5、4.0のGPU使用率はいずれも90%以上に達した。&quot;
李彦宏氏は、教育科学研究などの分野で、オープンソースモデルは価値があると分析した。しかし、ビジネス分野では、効率、効果、最低コストを追求している場合、オープンソースモデルには優位性はありません。
大きなモデルの応用進化方式についても、彼は自分の観点を表現した。まず現れたのはCopilotで、人を補助する。次はエージェントエージェントであり、一定の自主性があり、ツールを自主的に使用し、反省し、自己進化することができる、このような自動化の程度が再発展すれば、AI Workerになり、各方面の仕事を独立して完成することができる。
現在、スマートボディはますます多くの大手モデル会社や顧客の注目を集めており、李彦宏氏は、この発展方向を見ている人は多いが、今日までスマートボディは共通認識ではないと考えている。
　　&quot;スマートボディの敷居は確かに低い&amp ;quot;，彼によると、多くの人は大きなモデルをどのように応用するか分からないが、スマートボディは非常に直接的で効率的で簡単な方法であり、モデルの上にスマートボディを構築するのは非常に便利だという。

对标小鹏MONA M03推出AION RT 古惠南称不会亏本卖车

OpenAI高层变动引热议 CFO声称公司强劲地位仍未动摇

调改门店外租商户租期未满被强制清退？漩涡中的永辉超市又有新“烦恼”

凛冬真的将至吗？美光财报打脸大摩全球芯片股集体狂欢

李彦宏氏は大モデルの「走分」仮象を突き破った：ランキングはすべての実力未来モデルの差が大きくなることを意味しない

对标小鹏MONA M03推出AION RT 古惠南称不会亏本卖车

OpenAI高层变动引热议 CFO声称公司强劲地位仍未动摇

调改门店外租商户租期未满被强制清退？漩涡中的永辉超市又有新“烦恼”

凛冬真的将至吗？美光财报打脸大摩 全球芯片股集体狂欢

凛冬真的将至吗？美光财报打脸大摩全球芯片股集体狂欢