SHOUJIKE

「アプリケーションは変わらないが、モデルは常に変化する」という状況を踏まえ、エンタープライズレベルの AI アプリケーションをどのように構築すればよいのでしょうか。

2月7日のニュース:新年早々、AI分野に新たな輝かしいスター、DeepSeekが誕生しました。この新参者でありながら、勢いは止まるところを知りません。驚異的なスピードで世界を席巻し、ChatGPTを抜いて世界で最も急成長しているAIアプリケーションとなり、ますます多くの企業がDeepSeekシリーズのモデルを採用するようになりました。

実際、GPT4からClaude 3.5、o1に至るまで、過去1年間で同様のシナリオは当たり前のようにありました...今回の主役はDeepSeekですが、AI分野が依然として「モデル至上主義」の時代にあるという本質は変わりません。

より強力なモデルが登場すれば、一般ユーザーにとって最新のAIを利用するのは簡単です。対応するアプリ(今回のDeepSeekなど)をダウンロードして使い始めるだけです。しかし、大規模なモデルに依存するエンタープライズレベルのAIアプリケーションでは、常に最新モデルへの迅速かつシームレスなアクセスを確保することは容易ではありません。モデルの導入と利用に関連する一連のエンジニアリング上の問題を解決する必要があります。

ビジネスの観点から見ると、「モデル競争」の時代は「アプリケーションは変わらない、モデルは変わり続ける」時代と言えるでしょう。そのため、自社の一貫したアプリケーションを維持しながら、絶えず出現する新しいモデルの波にいかにシームレスに乗り切るかが、企業にとって最も喫緊の課題と言えるでしょう。

「単一のモデルが支配的になることはない」と、Amazon CEOのアンディ・ジャシー氏は、re:Invent 2024でAmazon独自の人工知能の展開に関する重要な洞察を共有した際に強調した。

この洞察に基づき、Amazon Web Services(AWS)は、エンタープライズレベルのAIアプリケーション構築を支援するための成熟したマインドセットとツールキットを既に備えています。例えば、AWSは当初から、DeepSeek-R1シリーズモデルをデプロイするための4つの方法を企業に提供していました。

Amazon Web Services がエンタープライズ レベルの AI アプリケーションを構築するために使用する考え方とツールを見てみましょう。

モデルの多様性の重要性を認識する

アンディ・ジャシー氏が以前の講演で述べたように、「データベース分野では10年間議論が続いており、様々なリレーショナルデータベースと非リレーショナルデータベースが利用されていますが、アナリティクス分野でも同様です。かつてはTensorFlowが唯一のAIフレームワークになると考えられていましたが、様々なフレームワークの出現が常に強調され、最終的にPyTorchが最も人気のあるフレームワークとなりました。」企業が大規模モデルに基づいてアプリケーションを構築する場合、求められる技術指標はアプリケーションシナリオによって異なります。レイテンシ、コスト、微調整機能、ナレッジベース連携機能、マルチモーダルサポート機能など、シナリオの具体的なニーズに応じて、すべてトレードオフの関係になります。

Amazon CEO アンディ・ジャシー氏が 2024 年 12 月に re:Invent 2024 で講演します。

DeepSeekを例に挙げると、同社は2024年12月にDeepSeek-V3モデルを発売した後、2025年1月20日にパラメータスケール6,710億のDeepSeek-R1およびDeepSeek-R1-Zeroモデル、そしてパラメータ範囲15億~700億のDeepSeek-R1-Distillシリーズモデルをリリースしました。さらに、2025年1月27日には、ビジョンベースのJanus-Pro-7Bモデルを追加しました。これらのモデルはすべてオープンソースです。公開情報によると、DeepSeekシリーズのモデルは、強化学習などの革新的なトレーニング方法を通じて推論能力に大きな優位性を持ち、類似モデルと比較して費用対効果が90%~95%高くなっています。

しかし、高速応答が求められるシナリオを例に挙げると、DeepSeek R1のディープシンキングモードは明らかに不適切です。最初のトークンの生成に30秒以上かかるのに対し、Amazon Novaモデルは応答の生成に数百ミリ秒しかかかりません。さらに、現在のDeepSeek-V3モデルはテキストからテキストへの変換モデルのみであり、グラフィックスなどのマルチモーダル情報の入力をサポートしていません。

DeepSeek のような強力なモデルであっても万能薬ではないことは明らかです。

Amazon Web Services は当初から「単一のモデルが市場を支配することはない」という認識に基づき、自社の大規模モデルを改良しながら、エンタープライズ ユーザーに幅広いモデルの「選択肢」を提供することに注力してきました。

現在、Amazon Bedrockでは、AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI、poolsideなどの企業の最新の大型モデルが販売されています。また、最近ではLuma AI Ray 2モデルも発売されました。

同時に、Amazon Web Services は Amazon Bedrock Marketplace 機能も開始し、DeepSeek-R1 を含む 100 を超える人気モデル、新興モデル、プロフェッショナル モデルを顧客に提供しています。

アンディ・ジャシー氏が述べたように、Amazon Web Services(AWS)は豊富で幅広いモデルを提供しており、お客様は独自のニーズに基づいて最適なソリューションを的確に選択できます。AWSはお客様のニーズと技術の進歩を重視し、有望な新興モデルと確立された業界ベンチマークの両方を網羅し、モデル選択肢を継続的に拡大しています。

エンタープライズグレードのAIツールの完全なスイートを構築する

シナリオに基づいて適切なモデルを選択することは、企業のアプリケーション構築における最初のステップに過ぎないことに留意することが重要です。構築が進むにつれて、エンジニアリング上の問題を解決する能力が、実装の成功に不可欠になります。

モデルのコスト、パフォーマンス、プライベート データに合わせてカスタマイズおよび最適化できるかどうか、セキュリティ、さまざまなサイズのモデルの複雑なスケジュール、増え続けるインテリジェント エージェントの種類など、これらはすべて、企業でのモデルの展開と使用において完全に解決する必要があるエンジニアリングの問題です。

DeepSeekを例に挙げると、V3やR1など、公開されている様々なモデルがあります。R1にも様々なサイズがあり、例えばDeepSeek-R1-Distillシリーズのモデルはパラメータ範囲が15億から700億ですが、R1とR1-Zeroはパラメータサイズが6710億です。R1を最大限に活用し、完璧な推論と応答を実現するには、便利なサポートツールも必要です。

Amazon Bedrock は、エンタープライズ AI アプリケーションの実用的なニーズに重点を置き、豊富なモデルに加え、幅広いツールと機能を提供しています。これには、低レイテンシーに最適化された推論、モデル蒸留、キューワードキャッシュなどが含まれており、推論効率を大幅に向上させます。例えば、モデル蒸留は、強力な大規模モデルからより小規模で効率的なモデルへと特定の知識を転送できるため、速度を最大 500% 向上させ、コストを 75% 削減します。

Amazon Bedrock は、企業が所有するデータに基づいたカスタマイズされた最適化をサポートします。これには、モデルの微調整、GraphRAG などのグラフデータのサポート、ドキュメント、画像、音声、動画から迅速かつコスト効率よく情報を抽出し、構造化された形式に変換する Amazon Bedrock Data Automation などの機能が含まれます。

Amazon Bedrock の責任ある AI の安全性と監査は、自動推論チェックを追加して事実上の誤りを簡単に識別し、生成された回答の精度を向上させるなど、ガードレールの機能を継続的に拡張することで、責任ある AI の実装に対する企業の投資を簡素化します。

Amazon Bedrock はエージェント機能の提供だけでなく、エージェントの迅速な開発に対応するためのマルチエージェントコラボレーション機能も導入しています。これにより、お客様は複雑なワークフローを実行するための専用エージェントを容易に構築・連携できます。マルチエージェントコラボレーションにより、プロジェクト内の特定のステップに専用エージェントを作成して割り当てることで、より正確な結果を実現できるだけでなく、複数のエージェントを並行してオーケストレーションすることでタスクを高速化できます。

現在、Amazon Web Services (AWS) は、DeepSeek-R1 モデル向けに 4 つの異なるデプロイ方法を提供しています。企業は、Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart、Amazon Bedrock カスタムインポート機能、Amazon EC2 Trn1 インスタンスなど、使い慣れた AWS 環境にこのシリーズのモデルを簡単にデプロイできます。

キャプション: Amazon Bedrock Marketplace で DeepSeek-R1 モデルを呼び出す

キャプション: Amazon SageMaker Jumpstart で DeepSeek-R1 モデルをデプロイする

要約すると、クラウドと AI 分野における Amazon Web Services のフルスタックイノベーションは、企業が世界をリードするモデルを活用するための 3 つの重要なサポートを提供します。

まず、クラウド自体の利点があります。ローカル展開と比較して、クラウド展開はより柔軟で拡張性が高く、分析やデータといったクラウド内の豊富で成熟した基本サービスとシームレスに統合できます。

第二に、多様なモデル選択が可能という利点があります。さまざまなシナリオに合わせて、コスト、性能、応答速度の異なるモデルを柔軟に選択できるため、最適なコストパフォーマンスの組み合わせを実現できます。

最後に、モデルをプロトタイプからエンタープライズの実稼働環境に移行する際に考慮すべき重要な機能がいくつかあります。コストの最適化、独自データに基づく精度向上、重要なセキュリティ、そして将来を見据えた複雑なマルチエージェントシステムの構築と管理など、エンタープライズレベルのAIスイートと言えるでしょう。

Amazon Web Services Greater Chinaのプロダクト部門ゼネラルマネージャー、陳小建氏は次のように強調しました。「Amazon Web Servicesは、グローバルクラウドコンピューティングのパイオニアでありリーダーであり、企業が生成型AIを構築・適用するための第一の選択肢です。クラウドの中核サービスレベルで継続的にイノベーションを起こすだけでなく、チップからモデル、アプリケーションに至るまで、あらゆる技術スタックにおいてブレークスルーを達成し、さまざまなレベルのイノベーションが互いに力を与え合い、協調的に進化することを可能にしてきました。このようなスタック全体にわたる大規模なイノベーションこそが、今日のお客様の開発ニーズを真に満たし、最先端技術の価値を迅速に実現し、様々な業界の未来を変革するのに役立つと信じています。」 (郭青)