OpenAIの「次の重大な突破」初のAIアシスタント製品か、来年1月に発表されるヒューマン・インタラクションの変革は到来したのか。
二八一霉
发表于 昨天 11:06
1264
0
0
メディアの報道によると、OpenAIはコードの作成、旅行の予約、電子商取引の自動買い物など、さまざまな複雑な操作を自動的に実行できる「Operator」という新しいAIアシスタント製品を発売する準備をしている。内部従業員の暴露によると、OpenAIリーダー層は2025年1月に同製品を発表する予定で、まず研究プレビュー版と開発ツールとして発売され、その際に開発者のためにAPIインタフェースを開放する。
記事によると、OpenAIはスマートボディに関するいくつかの研究プロジェクトを行ってきたという。ある人は、最も完成に近いのはWebブラウザでタスクを実行するための汎用ツールだと述べています。
AIアシスタント(AI Agent)は環境を感知し、意思決定と実行動作を行うことができるインテリジェントなエンティティであり、独立した思考、ツールを呼び出して所与の目標を段階的に達成する能力を備えており、C端に個性的な応用を提供することができるだけでなく、B端にコスト削減の効果的な方案を提供することもできる。一般ユーザーにとって、AIアシスタントの最も核心的な機能はAIが携帯電話を自律的に操作し、複雑な推理任務を支援することである。
OpenAIのアルトマン最高経営責任者はすでに退場の意思を明らかにしている。数週間前、Redditの「私に何でも聞いて」(Ask Me Anything)フォーラムで、「私たちはますます良いモデルを持っているが、次の大きな突破はAIアシスタントだと思う」と述べた。先月の同社の年次開発日に先立ったOpenAI記者会見で、同社のケビン・ワイル最高製品責任者は「2025年はエージェントシステムが最終的に主流に入る年になると思う」と述べた。
OpenAIの視点に立つと、ビジネス化の過程でますます大きな圧力に直面しており、ChatGPTの漸進的な改善はユーザーにより高い価格を支払うことを引き付けることができない可能性がある。幹部はAI開発への巨額の投資が価値があることを証明するために、画期的な製品を必要としている。
現在、OpenAIは多機能連携AI AgentであるSwarmをオープンソースしており、より効率的にタスクを遂行するために複数のエージェント連携を作成することができます。そのGPT o 1モデルは推論能力を強化し、複雑な問題の解決とユーザー相互作用の自然性の面で顕著な進歩を遂げ、AIエージェントシーンにもさらに適用できるようにした。
AIアシスタントはAGIへのコア基盤と見なされており、ハードウェアメーカーが必ずAIと呼ぶ時代には、AIアシスタントは端末のインテリジェント化の突破口となるかもしれない。甬興証券によると、AIエージェントはモバイル相互接続の新たな入り口を掌握するか、流量分配構造はAIエージェントエージェントの知能体が比較的強い相互作用性と利便性を備えているため、あるいは元の同じ端末の異なるApp間の天然障壁を打ち破ることができることが期待されている。
「科創板日報」の不完全な整理によると、国内外のヘッドメーカーがAIアシスタント製品の発売を争っている--
マイクロソフトは最近、パーソナルコンピュータを操作するためにユーザーが個人的なスマートボディを作成するのを支援するAIツールOmniParserを低調にオープンした。マイクロソフトは10月22日、Dynamics 365に10個の自主AIエージェントを統合し、OpenAI最新モデルo 1をサポートし、自主学習能力を備え、プラットフォーム間の複雑な業務を自動的に実行できる、9月、マイクロソフトはWindowsエージェント・アリーナというベンチマーク・フレームワークを発表し、同じくAIアシスタント開発のカテゴリーに属している。
The Informationによると、グーグルは12月に大規模なアクションモデル「Project Jarvis」をプレビューする予定で、このプロジェクトはユーザーが「研究の収集、製品の購入、フライトの予約」などのタスクを実行するのを支援する。
10月22日、Anthropicは大モデルClaudeのために新しい機能であるComputer Useを反復し、AIが人間のようにコンピュータを操作できるようにした。Claude 3.5 Sonnetは、カーソルの移動、ボタンのクリック、テキストの入力など、人間がコンピュータを操作することをシミュレートするコンピュータ制御をサポートする最初のモデルです。
アップルはSiriとChatGPTを統合し、よりスマートなヒューマン・インタラクションを実現することを選んだ。また、アップルがFerret-UIの2つの実装バージョン(それぞれGemma 2 BとLlama 8 Bに基づく)を黙々と発表していることに気づいたネットユーザーもいた。これはアップルが今年5月に発表したAIに携帯電話の画面を理解させる技術だ。
ファーウェイはAIが人間のように携帯電話を操作できるようにするための新しい研究成果を発表し、関連チームは携帯電話制御アーキテクチャを提案した:Lightweight Multi-modal App Control(軽量マルチモーダルアプリケーション制御、略称LiMAC)。
中国ユニコーン企業の智譜AIはすでにAIアシスタントツールAutoGLMをオンラインにしており、手動で操作する必要はなく、ユーザーが携帯電話に向かって話す(指令を出す)ことで、携帯電話の各種アプリを自動的に開き、ネット通販、出前、高速鉄道チケットの予約、さらには微信、現金入り封筒の奪い取り、モーメンツの評価、ノートの整理、攻略、論文のまとめを行うことができる。
中信証券によると、AutoGLMなどの端末AIアシスタント技術はより短い経路の対話形式をもたらし、音声コマンドを受けて複雑な操作を自動的に完了する能力は消費者に極めて便利であり、AI端末の目玉機能となり、消費者のアップグレード・モデルチェンジを誘致することが期待されている。
華泰証券も、AIアシスタントの着地は複数のレベルの産業チャンスをもたらし、その中で、Agent+端末は人間機のインタラクティブな変革を推進することが期待され、端末の販売価格の変化のほか、端末アプリケーションのビジネスモデルにさらに深い影響を与える可能性があると述べた。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
-
据媒体报道,OpenAI正准备推出一款代号为“Operator”的全新AI助理产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等。根据内部员工爆料,OpenAI领导层预计将在2025年1月发布该产品,首 ...
- 永远的希望
- 昨天 11:06
- 支持
- 反对
- 回复
- 收藏
-
【小摩辣评“特朗普2.0”:关税大棒料打击经济、重燃通胀!】摩根大通资产管理公司(JPMorgan Asset Management)首席全球市场策略师David Kelly周三表示,当选总统特朗普激进的关税计划,可能会减缓全球经济,并给 ...
- besharp
- 昨天 12:37
- 支持
- 反对
- 回复
- 收藏
-
本报讯 (记者李豪悦)11月12日,腾讯音乐娱乐集团(以下简称“腾讯音乐”)宣布其截至2024年9月30日止第三季度的未经审计财务业绩。 2024年第三季度,腾讯音乐娱乐集团业绩表现稳健,总收入为70.2亿元,同 ...
- 覃志辉
- 3 天前
- 支持
- 反对
- 回复
- 收藏
-
新华财经上海11月13日电芯片制造商英伟达和软银集团的电信部门软银公司周三表示,两家公司已经试运行了全球首个人工智能和5G电信网络。 两家公司表示,该网络可以同时运行人工智能和5G工作负载,这一过程被 ...
- 惡魔獵人
- 前天 12:36
- 支持
- 反对
- 回复
- 收藏