首页 报纸 正文

OpenAIの「次の重大な突破」初のAIアシスタント製品か、来年1月に発表されるヒューマン・インタラクションの変革は到来したのか。

二八一霉
1275 0 0

メディアの報道によると、OpenAIはコードの作成、旅行の予約、電子商取引の自動買い物など、さまざまな複雑な操作を自動的に実行できる「Operator」という新しいAIアシスタント製品を発売する準備をしている。内部従業員の暴露によると、OpenAIリーダー層は2025年1月に同製品を発表する予定で、まず研究プレビュー版と開発ツールとして発売され、その際に開発者のためにAPIインタフェースを開放する。
記事によると、OpenAIはスマートボディに関するいくつかの研究プロジェクトを行ってきたという。ある人は、最も完成に近いのはWebブラウザでタスクを実行するための汎用ツールだと述べています。
AIアシスタント(AI Agent)は環境を感知し、意思決定と実行動作を行うことができるインテリジェントなエンティティであり、独立した思考、ツールを呼び出して所与の目標を段階的に達成する能力を備えており、C端に個性的な応用を提供することができるだけでなく、B端にコスト削減の効果的な方案を提供することもできる。一般ユーザーにとって、AIアシスタントの最も核心的な機能はAIが携帯電話を自律的に操作し、複雑な推理任務を支援することである。
OpenAIのアルトマン最高経営責任者はすでに退場の意思を明らかにしている。数週間前、Redditの「私に何でも聞いて」(Ask Me Anything)フォーラムで、「私たちはますます良いモデルを持っているが、次の大きな突破はAIアシスタントだと思う」と述べた。先月の同社の年次開発日に先立ったOpenAI記者会見で、同社のケビン・ワイル最高製品責任者は「2025年はエージェントシステムが最終的に主流に入る年になると思う」と述べた。
OpenAIの視点に立つと、ビジネス化の過程でますます大きな圧力に直面しており、ChatGPTの漸進的な改善はユーザーにより高い価格を支払うことを引き付けることができない可能性がある。幹部はAI開発への巨額の投資が価値があることを証明するために、画期的な製品を必要としている。
現在、OpenAIは多機能連携AI AgentであるSwarmをオープンソースしており、より効率的にタスクを遂行するために複数のエージェント連携を作成することができます。そのGPT o 1モデルは推論能力を強化し、複雑な問題の解決とユーザー相互作用の自然性の面で顕著な進歩を遂げ、AIエージェントシーンにもさらに適用できるようにした。
AIアシスタントはAGIへのコア基盤と見なされており、ハードウェアメーカーが必ずAIと呼ぶ時代には、AIアシスタントは端末のインテリジェント化の突破口となるかもしれない。甬興証券によると、AIエージェントはモバイル相互接続の新たな入り口を掌握するか、流量分配構造はAIエージェントエージェントの知能体が比較的強い相互作用性と利便性を備えているため、あるいは元の同じ端末の異なるApp間の天然障壁を打ち破ることができることが期待されている。
「科創板日報」の不完全な整理によると、国内外のヘッドメーカーがAIアシスタント製品の発売を争っている--
マイクロソフトは最近、パーソナルコンピュータを操作するためにユーザーが個人的なスマートボディを作成するのを支援するAIツールOmniParserを低調にオープンした。マイクロソフトは10月22日、Dynamics 365に10個の自主AIエージェントを統合し、OpenAI最新モデルo 1をサポートし、自主学習能力を備え、プラットフォーム間の複雑な業務を自動的に実行できる、9月、マイクロソフトはWindowsエージェント・アリーナというベンチマーク・フレームワークを発表し、同じくAIアシスタント開発のカテゴリーに属している。
The Informationによると、グーグルは12月に大規模なアクションモデル「Project Jarvis」をプレビューする予定で、このプロジェクトはユーザーが「研究の収集、製品の購入、フライトの予約」などのタスクを実行するのを支援する。
10月22日、Anthropicは大モデルClaudeのために新しい機能であるComputer Useを反復し、AIが人間のようにコンピュータを操作できるようにした。Claude 3.5 Sonnetは、カーソルの移動、ボタンのクリック、テキストの入力など、人間がコンピュータを操作することをシミュレートするコンピュータ制御をサポートする最初のモデルです。
アップルはSiriとChatGPTを統合し、よりスマートなヒューマン・インタラクションを実現することを選んだ。また、アップルがFerret-UIの2つの実装バージョン(それぞれGemma 2 BとLlama 8 Bに基づく)を黙々と発表していることに気づいたネットユーザーもいた。これはアップルが今年5月に発表したAIに携帯電話の画面を理解させる技術だ。
ファーウェイはAIが人間のように携帯電話を操作できるようにするための新しい研究成果を発表し、関連チームは携帯電話制御アーキテクチャを提案した:Lightweight Multi-modal App Control(軽量マルチモーダルアプリケーション制御、略称LiMAC)。
中国ユニコーン企業の智譜AIはすでにAIアシスタントツールAutoGLMをオンラインにしており、手動で操作する必要はなく、ユーザーが携帯電話に向かって話す(指令を出す)ことで、携帯電話の各種アプリを自動的に開き、ネット通販、出前、高速鉄道チケットの予約、さらには微信、現金入り封筒の奪い取り、モーメンツの評価、ノートの整理、攻略、論文のまとめを行うことができる。
中信証券によると、AutoGLMなどの端末AIアシスタント技術はより短い経路の対話形式をもたらし、音声コマンドを受けて複雑な操作を自動的に完了する能力は消費者に極めて便利であり、AI端末の目玉機能となり、消費者のアップグレード・モデルチェンジを誘致することが期待されている。
華泰証券も、AIアシスタントの着地は複数のレベルの産業チャンスをもたらし、その中で、Agent+端末は人間機のインタラクティブな変革を推進することが期待され、端末の販売価格の変化のほか、端末アプリケーションのビジネスモデルにさらに深い影響を与える可能性があると述べた。
CandyLake.com 系信息发布平台,仅提供信息存储空间服务。
声明:该文观点仅代表作者本人,本文不代表CandyLake.com立场,且不构成建议,请谨慎对待。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  •   知名做空机构香橼研究(Citron Research)周四(11月21日)在社交媒体平台X上发布消息称,该公司已决定做空“比特币大户”微策略(Microstrategy)这家公司,并认为该公司已经将自己变身成为一家比特币投资基金 ...
    caffycat
    3 小时前
    支持
    反对
    回复
    收藏
  •   每经AI快讯,11月20日,文远知行宣布旗下自动驾驶环卫车S6与无人扫路机S1分别在新加坡滨海湾海岸大道与滨海艺术中心正式投入运营。据介绍,这是新加坡首个商业化运营的自动驾驶环卫项目。 ...
    star8699
    前天 19:48
    支持
    反对
    回复
    收藏
  •   上证报中国证券网讯(记者王子霖)11月20日,斗鱼发布2024年第三季度未经审计的财务报告。本季度斗鱼依托丰富的游戏内容生态,充分发挥主播资源和新业务潜力,持续为用户提供高质量的直播内容及游戏服务,进一步 ...
    goodfriendboy
    前天 20:09
    支持
    反对
    回复
    收藏
  •   百度创始人李彦宏19日在2024中国5G+工业互联网大会上发表演讲时表示,多智能体协作应用无代码工具"秒哒"发布不到3天,超过5000家企业排队申请测试。此外,L4级端到端的自动驾驶大模型发布后,搭载百度这一大模 ...
    laozhucn
    3 天前
    支持
    反对
    回复
    收藏
二八一霉 新手上路
  • 粉丝

    0

  • 关注

    0

  • 主题

    2