|
AIが愛する人を「蘇生」させ、大規模モデルが年次サマリーの作成を支援し、自動運転車が通勤者の送迎を行い、豆宝(Doubao)は月間アクティブユーザー数が7,000万人を超えています... AI企業が大規模モデルへの投資と成熟を続けるにつれ、2024年にはAIが現実世界のシナリオにますます適用されるようになるでしょう。 2025年、世界のAI業界はどのような新たな変化を経験するのでしょうか?どのようなブレークスルーが期待できるのでしょうか?AIスーパーアプリケーションは出現するのでしょうか?インフラから製品アプリケーションまで、北京人工知能研究院は2025年のAIトレンド予測を発表しており、そこから得られる知見は大きな示唆となるでしょう。 1. AIは将来の科学研究のパラダイムを変える 2024年にはノーベル物理学賞と化学賞がともにAI関連分野に授与され、「AI4S」と簡略化された「科学のためのAI」という概念も国内外の科学者から大きな注目を集めています。 現在、AIは様々な科学研究分野で成功を収めています。ノーベル賞受賞のAlphaFoldに加え、核融合トカマク装置におけるプラズマの形状制御にAI技術を活用するDeepMindなどのプロジェクトもこれに含まれます。 さらに、AIは実験研究のプロセスを加速させました。中国科学院院士の張金氏は、以前のイベントで、学生が1日に3セットの同一実験を繰り返すことは事実上不可能であると述べました。しかし、自動化プラットフォームは1日に150セットの実験を実行でき、実験の再現性を大幅に向上させます。高品質な実験データは、シミュレーショントレーニングの基盤となります。 北京人工知能研究院(BAAI)の報告書によると、大規模モデルを基盤とするAI4S(人工知能4次元化)は、科学研究におけるパラダイムシフトを推進する重要な原動力となっている。2024年には、AIを利用する研究者の割合が急速に増加し、AIが科学研究の方法とプロセスに与える変革的な影響が現れ始めた。 2025年までに、マルチモーダル大規模モデルは科学研究にさらに統合され、多次元データの複雑な構造のマイニングが可能になり、科学研究の問題の包括的な理解とグローバルな分析を支援し、バイオメディカル、気象学、材料発見、生命シミュレーション、エネルギーなどの分野における基礎科学研究と応用科学研究の新たな方向性を切り開きます。 2. 身体性知能の元年:大規模小脳モデルの試みがブレークスルーにつながる可能性 2024年、具現化された知能は最も収益性の高い技術分野の一つとなり、北米から中国に至るまで前例のない資金調達ブームを巻き起こしました。 北米市場では、Figure AIが6億7,500万ドル、ロボット工学の基本モデルに特化したSkild AIが3億ドル、Collaborative Roboticsが1億ドル、OpenAIが66億ドルの資金調達を達成しました。これは、資本市場が身体性知能分野に楽観的な見方をしていることを示しています。 中国市場では、メディアの統計によると、2024年の最初の3四半期だけで55件の資金調達取引が成立し、前年比21件増加しました。これらの取引には、美団(Meituan)による聯网(Unitree Robotics)と銀河将軍(Galaxy General)への戦略的投資、アリババによる星天(Star Era)への資金調達への参加、ファーウェイによる具現化知能産業イノベーションセンターの正式開設など、大手テクノロジー企業による投資が含まれています。 さらに、BYD、長安、広州汽車、奇瑞、小鵬、小米、蔚来、利汽車など、国内自動車メーカー10社近くが、将来的にアンドロイド開発競争に参入することを明言しています。テスラは、2025年末までに数千台のオプティマス・ヒューマノイドロボットがテスラ工場で業務を遂行し、2026年には外部顧客への納入を開始する予定です。 北京人工知能研究院は、2025年までに身体性知能がオントロジーから身体性脳の物語へと拡大し続けると予測しています。私たちは、以下の3つの側面において、さらなる発展を期待できます。 業界の展望では、約100社のエンボディ型スタートアップ企業が再編に直面し、メーカーの数が収束し始める可能性があります。テクノロジーの面では、エンドツーエンドモデルが継続的に改良され、小脳のビッグモデルの試みがブレークスルーを生み出す可能性があります。商業化の面では、産業シナリオでのエンボディ型インテリジェントアプリケーションも増加し、一部のヒューマノイドロボットが大量生産に入るでしょう。 3. 統合されたマルチモーダル大規模モデルにより、より効率的な AI が可能になります。 2024年には、主要モデルメーカーは単純にパラメータ規模で競争するのではなく、テキスト、画像、動画など異なる機能を組み合わせたマルチモーダルモデルを重要な開発領域として注力するようになるだろう。 2024年2月、OpenAIのSora動画モデルがリリースされ、世界に衝撃を与えました。その後、快手、ByteDance、テンセント、アリババといった中国の大手企業も独自の動画モデルシステムを立ち上げました。現在、快手のKeling AIとByteDanceのJimeng AIはそれぞれ独立したアプリをリリースしています。 現在の大規模言語モデルとスプライスド・マルチモーダルモデルは、人間の思考プロセスをシミュレートする上で依然として固有の限界を抱えていることに留意すべきです。北京人工知能研究院は、学習の初期段階からマルチモーダルデータを統合し、エンドツーエンドの入出力を実現するネイティブ・マルチモーダル技術アプローチが、マルチモーダル技術の発展に新たな可能性をもたらすと考えています。 これを踏まえ、トレーニング段階で視覚、音声、3D モダリティからのデータを調整してマルチモーダルの統一を実現し、ネイティブ マルチモーダル大規模モデルを構築することが、マルチモーダル大規模モデルの進化における重要な方向性となっています。 4. スケーリング法則の拡張: 事前トレーニングから事後トレーニングおよび推論の転送までのモデルの一般化。 2024年12月中旬、OpenAIの共同設立者であるIlya Sutskever氏は、事前トレーニングの時代は終わりに近づいているという非常に洞察力に富んだ見解を示しました。 イリヤ氏は、現在のコンピューティング能力の増加率がAIモデルのトレーニングに利用可能な総量を上回り、データの増加がボトルネックに近づいていると考えています。「既存のデータをトレーニングに使用することは依然として可能ですが、この傾向は最終的に鈍化し、事前トレーニングの時代は徐々に終焉を迎えるでしょう。」 Scaling Lawの速度低下という主張について、北京人工知能研究院の創設会長であり、国家工程院の外国人院員でもある張宏江氏は、最近のイベントで懸念していないと述べた。「事前学習の速度低下は否めませんが、GPT-o1のリリースは私たちに別の世界を見せてくれました。事前学習済みモデルの『高速思考』モードと比較して、推論モデルo1はより多くの思考時間を与えることができます。Scaling Lawの推論性能は『変曲点』に達し、指数関数的な成長を見せています。」 北京人工知能研究院(BAAI)は、基本モデルの性能向上をスケーリング則に頼る学習モデルの費用対効果は低下し続けており、学習後およびシナリオ固有のスケーリング則の探索が進められていると考えています。学習後および推論段階でスケーリング則を発見するための重要な技術である強化学習も、今後、より多くの応用と革新的な用途が見られるでしょう。 5. 世界モデルは加速的にリリースされており、マルチモーダル大規模モデルの次の段階となる可能性があります。 近年、人工知能の分野では「世界モデル」と呼ばれる新しい概念が登場しており、業界関係者の一部からは、これが AI の次の大きなフロンティアとみなされている。 ワールドモデルとは、リアルなだけでなく、行動とその結果をシミュレートする仮想3D環境を作成する高度なシミュレーション技術です。つまり、AIや人間のユーザーがその環境でインタラクションしたり、探索したり、遊んだりできる仮想世界ジェネレーターです。 「AIのゴッドマザー」と呼ばれるフェイフェイ・リー氏が設立したWorld Labsは、「大規模世界モデル」の構築に向けて2億3000万ドルを調達しました。同社は、ユーザーが物理的な変数を制御し、独自の3D「世界」を創造できる仮想3D空間を生成することを計画しています。リー氏は、この技術はアーティスト、デザイナー、開発者、エンジニアなどの専門家にとって非常に重要だと述べています。 2024年12月、Google DeepMindは最新の基礎世界モデル「Genie 2」を発表しました。これは、制御可能でプレイ可能な様々な3D環境を生成できます。NVIDIAは今年1月、同社初の生成世界基礎モデルであるCosmosをリリースしました。さらに、スタートアップ企業のDecartとOdysseyも独自の世界モデルを開発しています。 北京人工知能研究院は、因果推論を重視した世界モデルは、AIに高度な認知能力と、より論理的な推論および意思決定能力を与えると考えています。この能力は、自動運転、ロボット制御、インテリジェント製造といった最先端分野におけるAIの深層応用を促進するだけでなく、従来のタスクの限界を突破し、人間とコンピュータのインタラクションの新たな可能性を探求すると期待されています。 注目すべきは、世界モデルの開発は有望な見通しにもかかわらず、依然として多くの技術的課題に直面しているということです。例えば、世界モデルの学習と実行には、現在生成モデルに使用されている計算リソースと比較して膨大な計算能力が必要です。さらに、世界モデルは錯視問題の影響を受けやすいという問題もあります。 6. 合成データは大規模モデルの反復と応用にとって重要な触媒となるでしょう。 大規模モデルの学習・開発においては、データ、特に高品質データの需要が高まっていますが、現実世界で大規模モデルの学習に必要なデータ量はますます不足しています。北京人工知能研究院は、高品質データが大規模モデルのさらなるスケールアップの障害となると予測しており、基本モデルベンダーは合成データを補完する手段として好んで利用しています。 これは、OpenAIの共同創設者であるイリヤ・スツケバー氏の見解と一致しています。彼は次のように述べています。「事前学習は間違いなく終わりを迎え、同時にデータはもう存在しなくなります。なぜなら、インターネットは一つしか存在せず、モデルの学習に必要な膨大なデータは枯渇しつつあるからです。AIは、既存のデータから新たなブレークスルーを見つけることによってのみ発展し続けるでしょう。今後のブレークスルーは、インテリジェントエージェント、合成データ、そして推論時の計算にあるでしょう。」 合成データは、手作業によるガバナンスやアノテーションのコストを削減し、実データへの依存を軽減し、データプライバシーの問題を解消する効果があることが分かっています。また、データの多様性を高め、長文や複雑な問題への対応能力を向上させることにも役立ちます。さらに、合成データは、大企業による汎用データの独占や、独自データの高額な取得コストといった問題を軽減し、大規模モデルの実用化を促進する可能性があります。 現在、合成データを生成するためのツールは数多く存在します。例えば、NVIDIAの3Dシミュレーションデータ生成エンジンであるOmniverse Replicatorは、物理シミュレーションから合成データを生成し、自律走行車やロボットのトレーニングに利用できます。Microsoftはオープンソースの合成データツール「Synthetic Data Showcase」を提供しており、Appleが自社開発した人工知能システム「Apple Intelligence」も、事前トレーニング段階で合成データを広範に活用しています。 7. 推論の最適化と反復の加速は、AI ネイティブ アプリケーションの実装に必要な条件です。 業界関係者は、AIネイティブ分野が構想段階から大規模な商業化へと飛躍しつつあると考えています。2024年10月時点で、この分野は85億ドルの資金調達を達成しており、その中には、生成AI検索プラットフォームのPerplexityやGitHubの競合企業Poolsideなど、昨年それぞれ5億ドルの資金調達を行った複数の大規模投資が含まれています。 AIネイティブとは、人工知能技術を製品やサービスに深く統合し、単なるアドオンではなくコア機能として活用することを指します。その応用分野には、インテリジェントアシスタント(SiriやGoogleアシスタントなど)、レコメンデーションシステム(NetflixやSpotifyなど)、ウェアラブルAIデバイスやスマートグラスなどのネイティブハードウェアが含まれます。 北京人工知能研究院(BAAI)は、大規模モデルのハードウェアがクラウドから携帯電話やPCなどのエッジデバイスへと拡大していると指摘しています。これらのリソース制約(AIコンピューティング能力、メモリなど)のあるデバイスでは、大規模モデルの導入は推論側のオーバーヘッドに大きな制約があり、導入リソース、ユーザーエクスペリエンス、そして経済コストに大きな課題をもたらします。アルゴリズム加速とハードウェア最適化技術の継続的なイテレーションは、AIネイティブアプリケーションの急速な導入を促進しています。 8. エージェント AI は製品展開の重要なモデルになりつつあります。 2024年12月31日、OpenAIのCEOであるアルトマン氏はソーシャルメディア上で、OpenAIが2025年にリリースする予定の技術製品を発表しました。その第一弾として汎用人工知能(AGI)、続いてインテリジェントエージェントが挙げられました。アルトマン氏は率直に、「私たちはより優れたモデルを開発していくでしょうが、次の大きなブレークスルーはインテリジェントエージェントから生まれると信じています」と述べました。 AIエージェントは、AIによって駆動されるソフトウェアツールであり、最小限の監視で複数段階のタスクを実行できます。ビル・ゲイツは、インテリジェントエージェントをコンピューティングにおけるもう一つの大きな革命と呼び、人々がコンピューターとやりとりする方法を一変させ、さらにはソフトウェア業界全体に大きな混乱をもたらすと予測しました。 昨年、インテリジェントエージェントは大手テクノロジー企業の注目を集め始めました。アリババクラウドのModelScopeGPT、テンセントの元奇、バイトダンス傘下のLark Intelligent Partner、百度の文心インテリジェントエージェント、百川の百小影、iFlytekのiFlytek Youban、崑崙万威天宮SkyAgentsなど、国内の大手企業やAIスタートアップ企業がそれぞれ独自のインテリジェントエージェントプラットフォームやアプリケーションを立ち上げました。 IT サービスおよびコンサルティング企業の Capgemini が発表したレポートによると、AI エージェントの使用を開始している企業はわずか 10% 程度ですが、82% の企業が今後 3 年以内にエージェントをワークフローに統合する予定であるとのことです。 チャットボットやコパイロットからAIエージェントやエージェントAIまで、2023年以降、業界のAIアプリケーションフォームに対する理解は深まっています。北京人工知能研究院は、2025年までに、より汎用的で自律的なインテリジェントエージェントが製品のアプリケーションフォームを再形成し、仕事や生活のシナリオにさらに浸透し、大規模モデル製品の展開における重要なアプリケーションフォームになると考えています。 9. AI アプリケーションの人気は高まり続けており、スーパー アプリケーションの爆発的増加が目前に迫っています。 過去1年間で、生成モデルの画像および動画処理能力は飛躍的に向上しました。推論最適化によるコスト削減、そしてエージェント/RAGフレームワークやアプリケーションオーケストレーションツールといった技術の継続的な発展と相まって、AIスーパーアプリケーションの実装に向けた強固な基盤が築かれました。 2024年12月現在、豆宝(Doubao)の月間アクティブユーザー数は7,116万人に達し、中国で第1位、世界で第2位のAIネイティブアプリケーションとなっています。サービス指向のインテリジェントエージェント分野では、Ant Groupの「知小宝(Zhixiaobao)」や「大小彩(Maxiaocai)」といったAIバトラー製品シリーズが、AI製品のあり方を大きく変革しました。 しかし、モバイルインターネット時代のスーパーアプリが数億、あるいは数十億のユーザーを抱えているのに対し、AI時代のスーパーアプリはまだ登場していません。米国、欧州、中国を問わず、生成型AI機能を活用し、数十億のユーザーを獲得できるアプリケーションモデルの模索が活発に行われています。 人工知能研究院の業界研究グループ主任である倪先浩氏は、「スーパーアプリのタイトルを誰が獲得するかはまだ明らかではないが、ユーザー規模、インタラクション頻度、滞在時間から判断すると、AIアプリの人気は高まり続けており、アプリ爆発の前夜を迎えている」と述べた。 さらに、大企業は強力なチャネル構築能力を持っているため、AIスーパーアプリケーションを開発できる可能性が高く、これはスタートアップにとっては比較的難しいことだと指摘した。 10. モデル能力強化とリスク予防の両方を重視し、AIセキュリティガバナンスシステムは継続的に改善されています。 情報がかつてないほどのスピードで拡散する今日の世界では、AI システムが偏見、ディープフェイク、プライバシー侵害、著作権紛争など、さまざまな問題を引き起こしており、AI セキュリティに対する社会的な懸念が急激に高まっています。 これに伴い、様々な国や組織がAIセキュリティへの投資を継続的に進め、様々な形態の研究、ガバナンスフレームワーク、国際協力を模索してきました。2024年4月、国連科学技術会議は「生成型人工知能アプリケーションの安全性試験基準」と「大規模言語モデルの安全性試験方法」という2つの大規模モデルセキュリティ標準を発表しました。これら2つの国際標準は、OpenAI、Ant Group、iFlytek、Google、Microsoft、NVIDIA、Baidu、Tencentなど、数十の組織の専門家と学者によって共同で策定されました。 さらに、アントグループが独自に開発した大規模モデルセキュリティ統合ソリューション「AntSky Detection」は、20の外部機関・企業に提供されています。北京人工知能研究院(BAAI)は、中国初のAIセキュリティに関する国際対話のためのハイレベル非公開フォーラムを主催し、世界のAIリーダー、学者、業界専門家と共同で「北京AIセキュリティ国際コンセンサス」に署名しました。 要約すると、自律的意思決定における基本モデルの継続的な進歩は、制御不能に陥る潜在的なリスクをもたらしている。新たな技術規制方法をどのように導入するか、そして産業発展と人間による監督におけるリスク管理のバランスをどのように取るかは、AIに関わるすべての関係者にとって継続的な議論に値する課題である。(周小白) |
2025年に注目すべきAI技術トレンドトップ10:エンボディド・インテリジェンスに加え、注目の分野
関連するおすすめ記事
-
報道によると、イタリアの税務当局はプラットフォームXに対する調査を開始し、同社に1,250万ユーロの追徴税を求めているという。
-
LeapmotorのZhu Jiangming氏:私たちの次の目標は、10万元の価格帯で大きな市場シェアを獲得することです。
-
蘇寧電器は、従業員に不正なオンライン販売活動に従事させ、従事するまで退勤を妨害していたとして告発されている。蘇寧電器は「疑惑について検証する」と回答した。
-
主要企業の決算報告が相次いで発表され、AIクラウドに関する4つのシグナルが放たれた。
-
CATLとGACグループとの合弁会社は5万元の負債により執行対象となった。
-
中国車はどうすればよりグローバル展開できるだろうか?魏建軍氏は、ブラック・ミスが海外展開のモデルだと語る。