首页 报纸 正文

Soraはビデオをより想像力豊かにすることでアップルVision Proの普及を助けることができますか?

就放荡不羁就h
198 0 0

先週、米国の科学技術株は「資本の宴」を上演した。ソラ大モデルの発表を受けて、英偉達はAI会社の株価高騰をリードし、同社の時価総額は史上初めて2兆ドルの大台に触れ、Meta、マイクロソフトなどの会社の株価上昇を牽引した。市場関係者は、AIが英偉達の上昇をさらに推進することが期待されており、「2兆ドル」クラブに加入した後、英偉達がアップルの時価総額を追い抜くことはもはや遠く及ばないだろうとみている。
AIの大モデルに触発された科学技術の波の中で、アップルはスプーンを分けることができなかった。先月の時価総額がマイクロソフトに追い越されて以来、アップルの株価は下落している。同社が発表した重ポンドハイブリッドのリアルウェアラブル製品Vision Proの発表も、アップルの株価を押し上げることはできなかった。Vision Proが正式に発売されてから1カ月近く、アップルの株価の累計下落幅は6%を超え、現在の時価総額は2兆8000億ドルで、マイクロソフトより2000億ドル近く遅れている。
Vision Proのリリース当初、市場はこのデバイスに大きな期待を与えていた。アップルのクックCEOは、このデバイスの発表を「空間計算時代の到来」と宣言した。同氏は、「Vision Proは史上最も先進的な消費電子機器であり、その革命的で不思議なユーザーインタフェースは、私たちが連絡し、創造し、探索する方法を再定義するだろう」と述べた。
ソラの大モデルが発表された後、すぐにソラが生成したビデオをアップルVision Proが見ることができる3 D空間ビデオに変換するユーザーがいた。ある科学技術ブロガーは、「Sora+Vision Proは、世界を記述し、この世界に存在することができることを意味する」と話しています。
この観点から見ると、ソラの登場はVision Proにより多くのコンテンツをもたらした。しかし、専門家は第一財経記者に、ソラが作成したビデオは通常のビデオであり、空間計算に基づく空間ビデオではないため、Vision Proのために直接ビデオを作成することはできないと強調した。
「理論的にはすべてのビデオを空間ビデオに変換することができますが、ソラは空間計算を理解していません。生成されたビデオも普通のビデオなので、Vision Proとは直接関連していません」とある3 D生成型AIベンチャーの技術責任者は第一財経記者に語った。
自身もアップルのVision Proを使って3 Dビデオをいくつか作ったが、これらのビデオは展示だけで、Vision Proの将来のアプリケーションシーンをどのように開発するかについては、まだ成熟した考えはないと述べた。
彼は第一財経記者に、3 Dビデオは空間中の各画素点の位置情報などの空間情報を含む必要があり、「奥行き」(depth)とも呼ばれ、通常のビデオはdepthを生成することでVision Proが見ることができる3 D効果のある空間ビデオに変換できると伝えた。
上記の技術責任者は、短期的にSoraのビデオ生成は3 D生成にはまだ関与していないと考えている。3 Dとテキスト、画像とビデオ生成には本質的な違いがあり、その難点は高度に一致した連続多角画像を取得することではなく、工業規格にある。「そうしないと、写真モデリングはとっくにモデル生産を支配している」と彼は言った。
工業分野では、アップルはすでに3 Dソフトウェア企業との協力を求めている。ダッソー・システムのグローバル・ブランド執行副社長Philippe Laufer氏は、アップルと協力してVision Proのために新しいデザイン体験を開発していることを第一財経記者に明らかにした。「ダッソーシステムのビジネス顧客もアップルが非常に必要としている」とLaufer氏は述べた。
リヤドグループの劉耀東副総裁、仮想動点CEOは第一財経記者に対し、Soraの大モデルに対する論争の焦点の1つは物理世界を理解しているかどうかであり、これには空間感への理解が含まれており、現在発表されている情報から見ると、Soraはまだこの能力を備えていないと述べた。「わかりました。Soraは今、動くパズルの世界を生成できるようになっていますが、まだ2次元です」と述べた。
北京智源人工知能研究院の張宏江前理事長も第一財経記者に対し、ソラ大模型と空間計算は別物で、空間計算の概念には触れていないと述べた。
浙江大学人工知能研究所の呉飛所長は技術の角度から、Soraはまずテキスト単語と視覚サブブロックを同型低次元隠性空間にマッピングし、この低次元隠性空間に拡散モデルを導入し、視覚情報に対して繰り返し、テキスト単語、空間サブブロックと時間空間サブブロックの間の関連関係を掘り起こしたと紹介した。
「この方法は、まず『車同軌、書同文』を通じて、テキスト、視覚などの異種情報を同種空間に投影し、それから『先に破壊(騒音を追加)』、『再構築(騒音を除去)』の反復手段を通じて、ビデオ中のさまざまな単元の時間と空間中の関連関係を理解し、それによってテクスチャ、運動、光照射、遮蔽、相互作用などの複雑な視覚物理法則を識別し、学習することができる」と呉飛氏は科学普及論文で書いている。
しかし、Soraの大モデルと空間計算の両者の結合は、将来的には物理世界に対するより深いシミュレーションと理解の方法を開き、いわゆる「元宇宙」の実現を加速させる可能性があるという業界関係者もいる。
研究機関Canalysアナリストの劉健森氏は第一財経記者に対し、「生成式AIは元宇宙のような仮想世界建設に役立つと言えるので、SoraはVision Proの生態応用をある程度後押しするが、Vision Proの最初の利用者は業界開発者を中心にしており、個人消費者への普及にはもう一つの過程が必要だ」と述べた。
Canalysはこれまで、Vision Proは発売後1年以内に欠品に直面する可能性があり、5年後の生産量はiPhoneの現在の出荷量の約1%にあたる1260万台に増加する可能性があると予測していた。その際、Vision Proのユーザー数はMacBookの搭載量の15%にあたる2000万人に達する見込みだ。
最近、Vision Proの最初のユーザーが返品されたとネット上で噂されているが、劉健森氏は第一財経に対して、同機構のVision Proへの需要は当初の予想を維持している。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   每经AI快讯,据亿航智能官微消息,公司EH216-S无人驾驶电动垂直起降航空器(eVTOL)获得巴西国家民航局颁发的试验飞行许可证书,并计划在巴西进行测试和试飞。关于EH216-S无人驾驶eVTOL在巴西的认证,中国民航局 ...
    潇湘才子
    昨天 08:41
    支持
    反对
    回复
    收藏
  •   今年7月,美国三大海外“债主”所持美国国债齐刷刷缩水,其中日本美债持仓已降至去年10月以来最低。   根据美国财政部当地时间9月18日公布的国际资本流动报告(TIC),2024年7月,美国前三大海外“债主”日本 ...
    520hacker
    3 天前
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者俞立严)9月19日,蔚来全新品牌乐道的首款车型——乐道L60正式上市。新车定位家庭智能电动SUV,在采用BaaS电池租用服务后,L60的售价可低至14.99万元,电池租用月费最低为599元。乐道L6 ...
    anhao007
    前天 11:03
    支持
    反对
    回复
    收藏
  •   每经记者袁园   日前,国务院印发的《关于加强监管防范风险推动保险业高质量发展的若干意见》提出,以新能源汽车商业保险为重点,深化车险综合改革。   “车险综改”从2015年就已经开始逐步推进了,经过 ...
    moshulong
    前天 21:50
    支持
    反对
    回复
    收藏
就放荡不羁就h 注册会员
  • 粉丝

    0

  • 关注

    0

  • 主题

    32