|
1月24日、OpenAIはユーザーに代わってウェブベースの操作を実行できる初のAIエージェント「Operator」のリリースを発表した。 Operator は現在、米国の Pro 加入者向けに提供されており、将来的には Plus、Team、Enterprise 加入者にも拡張され、これらの機能は ChatGPT に統合される予定です。 Operator は、GPT-4o の視覚機能と強化学習によって実現される高度な推論を組み合わせた CUA と呼ばれる新しいモデルを搭載しています。 トレーニング後、Operatorはブラウザのコンテンツを「認識」し、マウスとキーボードで可能なすべての操作を使ってウェブページを操作できるようになります。例えば、公式デモでは、Operatorがレストランを予約したり、オンラインショッピングサイトで買い物をしたりすることが示されました。 しかし、OpenAIは、Operatorが既に市場で最も強力なAIエージェントである一方で、人間のエージェントには程遠いことをユーザーに注意喚起しています。そのため、この新しい技術はまだエラーが発生しやすいものの、今後数か月で改善が続けられる予定です。(Xiao Jian) |
OpenAI は、ブラウザを制御して買い物や食べ物の注文などのタスクを自動的に完了できる初の AI エージェント「Operator」をリリースしました。
関連するおすすめ記事
-
NvidiaのCEO、ジェンスン・フアン氏は市場の課題に対応し、顧客へのサービスと春節の雰囲気を楽しむことに重点を置きながら、静かに深センに到着した。
-
百度の創立25周年を記念して、ロビン・リーは全社員に宛てた手紙の中で、AIネイティブアプリケーションは2025年も爆発的な成長を続けるだろうと述べた。
-
報道によると、Apple の App Store は、ユーザーがダウンロードする価値のあるアプリを見つけられるように AI を活用したレビュー概要を導入する予定だという。
-
Apple の Web サイトにまたしても失態がありました。「iPhone」が「iPone」と誤って記載されています。
-
百度文心大型モデル4.5が3月16日に発売されることが確認されました。
-
Huawei 輪番会長 徐志軍氏:15,000 以上の HarmonyOS ネイティブ アプリケーションとメタ サービスがリリースされました。