|
ザッカーバーグ氏がFacebookをMetaに改名して以来、同社は完全に眼鏡に夢中になっている。 あまり知られていない、興味深くも珍しい事実があります。Metaという名前は「metaverse(メタバース)」の最初の4文字に由来しています。2021年に名称が変更された際、ザッカーバーグ氏自身が自信を持ってこう述べました。 メタバースは、今後 10 年間で 10 億人に到達し、私たちが開発するすべての製品にも到達するでしょう。 4年が経ち、メタバースはSF小説、創作アニメ、映画・テレビ作品に頻繁に登場するようになりましたが、現実世界からはますます遠ざかっています。人々の注目を集められるのは、メタバースや仮想資産を装い、時折ソーシャルメディアで爆発的に流行り、人々を欺き、欺く厄介なものばかりです。 メタバースの普及と拡大という点では、Metaは過去4年間大きな変化はありません。しかし、メタバースの入り口となるVR/ARヘッドセットなど、多くの興味深い新ガジェットを開発してきました。 新しいタイプのゲーム機として位置づけられたMeta Questは、VRインタラクティブゲームの新たな世界を切り開きました。2024年には、Meta Questシリーズは73%の市場シェアを獲得し、競合他社を大きくリードしました。 AI時代のトレンドアクセサリー、レイバンメタは、2世代にわたる製品開発を経て、今年2月に出荷数200万個を達成しました。伝統的なメガネ、ブランドロゴ、Bluetoothヘッドフォン、音声アシスタント、Vlogカメラなどを組み合わせ、伝統的なメガネの装飾機能を満たしながら、テクノロジーを日常生活にシームレスに融合させています。 表面上、Meta は消費者市場でいくつかの成功した製品を発売していますが、水面下では B2B 分野にも静かに取り組んでおり、企業や専門機関を対象としたこれらのスマート グラスは、社名変更前から始まっていました。 5年間の合意が成立し、Meta社は報告書を提出した。 2020年、Metaは初の実験的なスマートグラスであるMeta Aria Gen 1を発売しました。従来のグラスと比較すると、Aria Gen 1は少し大きく、特に2つのテンプルが厚くなっているのが目立ちます。 この巨大な外装は単なる装飾ではありません。RGBカメラ、測位・追跡カメラ、慣性計測装置(IMU)、気圧計、磁力計といった多数のセンサーが搭載されています。これらのコンポーネントの主な機能は、一人称視点で視覚、動き、空間データを収集することです。 理論的には、Aria Gen 1は機械知覚システム、人工知能、ロボット工学の研究に特化して設計されています。マルチモーダルセンサーを統合することで、研究者は環境認識や空間位置特定といったARグラスの核となる技術的課題を克服することができます。 実際のユーザー エクスペリエンスの点では、Aria Gen 1 には非常に遠いながらもエキサイティングなミッションがあります。 デバイスにかがみ込むことなく、インターネットのあらゆるメリットを享受できる日を想像してみてください。友人に電話をかけ、テーブル越しにリアルなバーチャルアバターとチャットする姿を想像してみてください。 道路上の危険を検知し、ビジネス会議中に統計情報を提供し、さらには騒がしい環境で聞き取りやすくするなど、十分にスマートなデジタル アシスタントを想像してみてください。 この世界では、デバイス自体は日常生活の浮き沈みの中に完全に溶け込んでいます。 この実験のプロトタイプであり第一世代製品であるAria Gen 1は、大きな話題にはなりませんでした。5年間の開発期間を経て、Metaは今週、Aria Gen 2を正式にリリースしました。第一世代と比較して、全面的なアップグレードが施されています。 最も顕著な変更点はセンサーシステムです。第1世代では、カメラと慣性センサーという最も基本的な環境認識要素のみを搭載していました。Aria Gen 2では、RGBカメラ、6DOF SLAMカメラ、視線追跡カメラ、空間マイク、IMU、気圧計、磁力計、GNSSなど、多くの新しいアクセサリが追加されています。 特に、新世代の製品には、鼻パッドに 2 つの革新的なセンサー (心拍数を測定する PPG センサーと、装着者の声と観察者の声を区別する接触型マイク) が組み込まれています。 第一世代を「メガネだけで世界を見る」ことに例えるなら、Aria Gen 2はすべての感覚を開放し、より多くの次元から外界を知覚し、観察し、情報を収集すると言えるでしょう。同じ時間でより正確なデータを取得できるようになり、機械の動作と学習の効率はより高まります。 さらに、データ処理方法にも質的な変化がありました。Aria Gen 1はコンピューティングに外部デバイスに依存しています。ローカル計算を行わないため、デバイスの重量はある程度軽減されますが、応答速度が遅くなります。クラウドのコンピューティングパワーは十分ですが、ネットワークの状態が悪いと応答が遅くなることがあります。スマートアシスタントを頻繁に使用する友人は、同じような状況に遭遇したことがあるはずです。モバイルコンピューティングプラットフォームを持ち歩くのは非常に不便です。 Aria Gen 2 は、デバイス側でデータを処理できる Meta の独自開発チップを使用しているため、応答速度が非常に速く、ネットワーク制限がなく、インタラクティブ エクスペリエンスが大幅に向上します。 一般的に、自社開発チップを搭載したデバイスはエッジコンピューティング機能を強化しますが、重量も増加します。しかし、Metaのデータによれば、過去5年間、デバイスはアイドル状態になっていないことが示されています。Aria Gen 1の重量は98g、Aria Gen 2の重量は75gです。体積は増えずに重量は増加し、重量は増加せずにユーザーエクスペリエンスが向上しています。 Aria Gen 2のもう一つの強みは、そのインタラクション方法です。第一世代の音声インタラクションをベースに、第二世代では「視線追跡 + ジェスチャー + タッチ操作」が追加されました。音声インタラクションは非常に直接的で、探索経路が大幅に短縮されますが、ラッシュアワーの地下鉄駅や非常に静かなオフィスなど、生活のあらゆるシーンに適しているわけではありません。 論理的に考えると、センサーやインタラクティブ機能の増加はバッテリー寿命に影響を与えるはずです。自社開発チップはAria Gen 2のバッテリー寿命に影響を与えますが、それはプラスの影響です。公式発表では6~8時間の使用が可能とされています。現在のワイヤレスイヤホンの使用時間に基づくと、これによりAria Gen 2は実質的に一日中スマート機能を維持できることになります。 堅牢なハードウェア基盤により、ユーザーエクスペリエンスの可能性は大きく広がります。Aria Gen 2のアップグレードは、MetaのAR技術実装における2つの主要な戦略的方向性を反映しています。 まず、ステルス技術の統合です。軽量設計とセンサーの隠蔽(例えば、カメラインジケーターライトがオフの時は普通のメガネのように見える)により、デバイスの存在感を低減します。次に、オープンエコシステムを通じて、デバイスは基盤となるAPIインターフェースとモジュール式の拡張機能を提供し、学術機関によるカスタマイズツールキットの開発と技術移転の加速を促進します。 そのため、Aria Gen 2 の応用シナリオは、これまでの屋内ナビゲーションや基礎 AR 研究から、医療、産業、都市計画などのより多様な分野に移行しており、これらはすべて Aria Gen 2 の成長にとって肥沃な土壌となる可能性があります。 最後に、Aria Gen 2 の進歩と重要性をまとめてみましょう。 アップグレードされたセンシングハードウェアにより、生物学的データの融合と環境の深い理解が可能になります。 自社開発のチップを搭載し、リアルタイムパフォーマンスを向上させ、ネットワークにアクセスできない屋外シナリオをサポートします。 インタラクティブな方法を充実させ、音響干渉を減らし、複雑な実験環境に適応します。 バッテリー寿命は一日中持続し、連続使用時間が延長され、装着感が向上します。 アプリケーションシナリオの拡大により、学際的な技術の統合と標準化が促進されます。 ザッカーバーグの「ダークサイド」 Meta Ariaの説明を読んでも、消費者市場への応用についてまだ少し戸惑っている方もいるかもしれません。Metaはこの製品を「消費者には販売しない」と明言しているからです。では、一体何に使われるのか疑問に思うかもしれません。その目的を説明するには、10年以上も遡る必要があります。 2014年、ザッカーバーグ氏はスタンフォード大学のバーチャル・ヒューマン・インタラクション・ラボ(VHIL)で最新のVR機器と様々なゲームシナリオを体験しました。VRヘッドセットを装着した状態で、丸太橋を渡ったり、街の上空を飛んだり、木々を切り倒したり… 当時VHIL Labsのマネージャーだったコーディ・ウォプツ氏は、高高度落下のシナリオを体験したとき、彼(ザッカーバーグ)はあまりにも怖かったので胸に手を当てたと明かしたことがある。 この経験はザッカーバーグに深い印象を残しました。VRはまだ研究の初期段階にあったため、位置決めシステムが不安定で、体験が何度も中断され、機器を止めて再調整する必要がありました。さらに、当時のVRはオールインワンデバイスではなく、PC VRのコンピューティング端末はデバイスの外にあり、信号と電力を伝送するために太くて長いケーブルで接続する必要がありました。 一方、ザッカーバーグ氏はこの革新的な技術の将来的な大きな可能性を予見していました。この経験が、20億ドルでOculusを買収することを決意させたのです。ザッカーバーグ氏は発表の中で、買収の理由を次のように説明しています。 モバイルは現在のプラットフォームであり、Oculus の買収は将来のプラットフォームへの準備です。 その後、ザッカーバーグはFacebookを率いてAR/VR/MR技術とデバイスの探求を進めました。明確な目標と蓄積されたハードウェア技術を背景に、Metaは2020年に「人間の視点からARとAIを加速させる」ことを目的としたProject Ariaを正式に立ち上げました。 少し抽象的に聞こえるかもしれませんが、もっと簡単に説明すると、メガネは橋渡し役として機能し、デバイスが人間の視点から世界を観察し理解し、人間と環境の相互作用を学習することを可能にします。これがソフトウェアとハードウェアの技術開発を促進し、最終的には機械が人間から生まれ、人間に役立つようになるのです。 Project Ariaのグラスは、画期的な技術によって、研究者がユーザーの視点から情報を収集するのに役立ちます。特に、Aria Gen 2に搭載された新しいセンサーは、装着者の周囲の環境の音声と映像に加え、眼球の動きや位置情報も取得できます。 装着者の一人称視点を取り入れることで、研究者は、派手だが実用的ではない機能としてではなく、AR が現実世界や日常生活でどのように実際の役割を果たすことができるかを理解しやすくなります。 さらに、このトレーニング方法は人間のマルチモーダル認知をシミュレートできるため、人間の視点から現実世界から情報を収集することは、マルチモーダル AI にとって非常に重要です。 私たちは視覚、聴覚、触覚といった感覚の組み合わせを通して世界を認識します。マルチモーダルAIは、テキスト、画像、音声、動画などのデータを統合することで、人間の自然な認知パターンに近づけることができます。さらに、クロスモーダルな情報を統合する能力は、シングルモーダルAIでは実現できないものです。 マルチモーダルなデータ収集と学習は、複雑なシナリオにおけるAIの意思決定精度を向上させることにもつながります。多次元情報を通して世界を理解しなければ、「買い手の視点」と「売り手の視点」の間には必然的に乖離が生じます。デジタルの世界には0と1しかありませんが、現実の世界には白黒に加えて、理解しがたいグレーゾーンが存在します。 インタラクション自体はマルチモーダルです。友人と会話をする際、言語に加えて、表情、身振り、声のトーン、さらには服装さえも理解に影響を与えます。そのため、マルチモーダルAIはテキスト、画像、音声を同時に処理することで、より自然なインタラクティブ体験を実現します。 MetaはProject Ariaにおける研究の詳細も明らかにしました。Project Ariaでは、スマートグラスが世界を理解する方法は非常にシンプルで分かりやすい、つまりデータ化です。SceneScriptと呼ばれるこの技術は、自己回帰構造化言語モデルとエンドツーエンド学習を用いてシーンの形状を表現・推測する手法です。 簡単に言えば、一人称視点で見たすべてのシーンとオブジェクトは、メガネによって特定の数字と名前に変換されます。テーブルの長さや壁にある透明な規則的な穴は「ウィンドウ」と呼ばれます。 メガネの内蔵モデルが世界を見るだけでなく、より深く理解できるようにするために、Meta は自社開発の 3D イメージング技術 EMF3D を使用して、現実世界のすべての物体をさまざまな色の線で「明確にラベル付け」し、さまざまな素材、形状、サイズの物体の測定を統一しました。 メガネが環境を読み取り、記録できるようになると、仮想世界の再現がはるかに容易になります。本プロジェクトの環境合成技術は、大規模な屋内シーンデータセットを、広範なデータ収集と整理を通じて完全にシミュレーションされ、手続き的に生成された状態で再現します。これにより、「デジタルツイン」の新たな基準が確立され、3D物体検出、シーン再構築、シミュレーションから現実への学習といった課題の研究が加速します。 この「育成型」学習法には長所と短所があります。長所は、一度学習すればそれが非常に定着することです。難点は、確実な習得を達成するには膨大な量のデータが必要となることです。そのため、Project Ariaには多くのボランティアが参加し、Metaグラスを長時間装着する必要があります。 適切な人物を見つけることよりも重要なのは、サービスの利用において安心感を与えることです。データ収集とプライバシー保護は本質的に相反する問題だからです。Metaのソリューションは、画像内のPII(Portable Information Interface)を検出してぼかし、顔やナンバープレートなどの機密情報を直接隠すことでプライバシーを保護する、革新的な「自己ぼかし」AIモデルです。 拡張学習により、モデルはユーザーの意図をより深く理解できるようになります。例えば、ユーザーの日常生活のシナリオをスキャンして要約することで、ユーザーがどの時間に何をする可能性が高いか(階下に降りて運動するのか、リビングでゲームをするのか、キッチンで料理をするのかなど)を判断できます。人の行動を予測できるようになることで、より便利な機能を事前に提供できるようになります。 これは、特定の時間に帰宅途中の交通状況や翌日の天気に関するリマインダーをポップアップ表示する、携帯電話のスマートアシスタントの機能に似ています。 プロジェクト Aria が開始されてから 5 年が経ち、第一世代の Aria グラスを使用して収集された Ego-Exo4D データセットなど、いくつかの成果が達成されました。このデータセットは、現代のコンピューター ビジョンや進化を続けるロボット工学の分野における基本的なツールとなっています。 いくつかの企業はすでに、Ariaを自社のワークフローにどのように活用すべきか検討を始めています。例えば、BMWはスマートカーに拡張現実(AR)と仮想現実(VR)のシステムを統合する方法を模索しています。 ジョージア工科大学の研究者らは最近、Aria が自宅に来たときに家事の負担を軽減できる仕組みを実証しました。 以前、モバイルスマートアシスタントをレビューした記事で、人工知能と様々な電子機器を組み合わせることの最大の意義は、現代社会における高齢者や障害者が新しい時代と新しい生活にスムーズに適応できるよう支援することにあると主張しました。Ariaはアクセシビリティ技術の開発においても一定の進歩を遂げています。 カーネギーメロン大学は、目の不自由な人や視覚障害者が屋内で移動できるようにするための技術の開発を目的としたプロジェクトで、第 1 世代の Aria グラスを使用しました。 第 2 世代 Aria の AI 音声機能は、Envision によって独自の Ally AI および空間オーディオ システムにも統合され、屋内ナビゲーションとアクセシビリティが向上しています。 Project Aria、Meta、そしてそれぞれの製品の関係を一言で表すとすれば、木の根、幹、枝のようなものです。Project Ariaは最下層に位置し、通常は目に見えず、実体もありませんが、長年にわたり蓄積されてきた技術的成果は、最終的には会社とその様々な製品を様々な形で力強く支えていくでしょう。 昨年9月下旬、製品発表イベントでザッカーバーグ氏は、一見普通のスマートグラスデバイスであるMeta Orionを金庫から取り出しました。これは、実は10年前の極秘プロジェクトの一部でした。デモ映像では、Vision Proと非常によく似たインタラクティブ機能を実現できることが示されていました。さらに重要なのは、Orionが真のホログラフィックARグラスデバイスであるということです。 通常のメガネよりも少し厚く見えますが、装着するとレンズを通して現実世界と投影された映像の両方を見ることができます。 従来のテレビやプロジェクターほど鮮明ではありませんが、画像や文字を見るには十分すぎるほどです。驚いたことに、目には大きなプリズムが見当たりませんでした。この驚くほどリアルで、まるで何もないところから現れたかのような効果は、レンズの周囲にLEDプロジェクターを設置し、シリコンカーバイドレンズに画像を投影することで実現されています。 フレームを囲む7台のカメラとセンサーにより、Meta Orionは仮想現実を現実世界に投影し、シームレスに統合することが可能です。ホログラフィック映像を空中に正確に浮かび上がらせ、前方の物体を認識することができます。例えば、テーブルの上の材料に基づいてカスタマイズされたレシピを作成することもできます。 Orionは、手と視線のトラッキングを真にサポートしており、インタラクティブ体験の点ではVision Proに匹敵すると言っても過言ではありません。あなたの手がコントローラーとなり、付属のニューラルリストバンドを使えば、手をマウスに変えることも可能です。筋肉の電気活動の変化を検知することで体内の神経信号を識別し、異なる指の動きを区別します。 親指と人差し指でつまんで選択する 親指と中指を同時に使ってメニューを表示します 握りこぶしを作り、親指をスライドさせて画面をスクロールします 発表イベントでは、Meta Orionの実際の分解も見学でき、非常に複雑で精密な内部構造が明らかになりました。最終的に組み立てられた本体の重量はわずか98gでした。 Meta Aria Gen 2とMeta Orionの関係は、まるで鏡に映った鏡のようだと容易に想像できます。しかし、ザッカーバーグ氏は当時のインタビューで、コストが高騰したため(1台あたり約1万ドル、約7万人民元)、量産を中止し、社内研究開発用に1,000台のみを製造したと述べています。 しかし、Meta社は2026年以降、Aria社の技術をOrionを含む消費者向けARグラスに徐々に統合していく計画だ。目標は、ニューラルインターフェースインタラクションとホログラフィックディスプレイを通じてARグラスを変革し、スマートグラスに「iPhoneの瞬間」をもたらすことだ。 文:オボ |
ザッカーバーグ氏の新しい未発表製品は、AIグラスの究極の形を探るさらなる試みだ。
関連するおすすめ記事
-
報道によると、JD.comの配送サービスは経営陣の交代が行われ、元Meituan幹部がDada Groupの中核事業ラインを引き継いだという。
-
TechWeb イブニングニュース: Apple が iPhone 13/14 Pro の「抵抗者」に呼びかけ、雷軍が Xiaomi Driving School を開設?
-
トヨタ自動車は中国での戦略を強化、上海に完全所有の電気レクサス工場を建設し、2027年に生産を開始する計画だ。
-
電気航空機の新興企業Liliumが操業を停止し、従業員1,000人を解雇。同社は以前、テンセントから投資を受けていた。
-
TechWeb イブニングニュース: iPhone SE 4 の価格が上昇、テスラはインドに初の店舗をオープン予定。
-
ボストン・ダイナミクスの創設者は、ユニツリー・ロボティクスを買収したことを明らかにし、ディープシークのイノベーションは「始まりに過ぎない」と述べた。