SHOUJIKE

Amazon Web Services (AWS) は、2 年間で 80 億ドルを投資し、Anthropic モデルによって顧客が確実にファーストクラスの地位を確保できるようにしています。

11月27日、40億ドルという巨額の投資がAIコミュニティに衝撃を与えたというニュースが報じられました。

Amazonは、OpenAIの強力な競合企業であるAnthropicと新たな戦略的パートナーシップ契約を締結しました。AmazonはAnthropicに40億ドルの第2次投資を行い、ビジネス協力を深めます。

これはAmazonによるAnthropicへの最新の投資であり、昨年9月に発表された40億ドルの投資に続くものです。わずか2年足らずで、AmazonのAnthropicへの総投資額は80億ドルに達しました。

公開情報によると、両社が昨年9月に戦略的パートナーシップを初めて発表した当時、Amazon Web Services(AWS)はAnthropicの優先クラウドサービスプロバイダーでした。そして今回、AWSは「モデルトレーニングの優先パートナー」に加わりました。AWSはAnthropicの主要クラウドサービスプロバイダーおよび大規模モデルトレーニングパートナーとなります。Anthropicは、将来の基盤モデルのトレーニングと展開にAmazon TrainiumとAmazon Inferentiaチップを使用する予定です。

実際、このコラボレーションのもう一つの重要な側面は、Amazon Web Services(AWS)のお客様がAmazon Bedrockを通じて最新のAnthropicモデルをリリースと同時に利用できることです。昨年Anthropic Claude 3シリーズとアップグレードされた3.5シリーズモデルの人気が継続していることから、このメリットは間違いなくさらに価値を高めています。

アントロピック・モデルは極めて良好なパフォーマンスを示し、アマゾンの投資が「正しい賭け」であったことを証明した。

Anthropic は、2021 年に Dario Amodei と Daniela Amodei によって設立され、サンフランシスコに本社を置く人工知能企業です。

2023年、タイム誌はダリオ・アモデ氏とダニエラ・アモデ氏を人工知能分野で最も影響力のある100人に選出し、「リーダー」として同率1位となった。続いてOpenAIのCEO、サム・アルトマン氏が続いた。

Anthropicの創業者2人はOpenAIの研究者でした。Anthropicの大規模モデルシリーズであるClaudeシリーズは業界で高い評価を得ており、OpenAIの最大の競合相手とみなされています。

2024 年 3 月、Anthropic は Claude 3 モデル シリーズを発売しました。このシリーズには、機能順に、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus の 3 つのモデルが含まれています。

Claude 3 のリリース以来、このシリーズのモデルは、生成 AI モデル開発の分野で常にトップクラスに位置しています。

2024年6月、Anthropicは同社最強モデル「Claude 3.5 Sonnet」をリリースしました。前モデルと比較して推論速度は2倍、呼び出しコストは5分の1を誇り、複数のベンチマークにおいてOpenAIの最強モデル「GPT-4o」、Googleの「Gemini 1.5 Pro」、そしてAnthropic自身のこれまでの最強モデル「Claude 3 Opus」を上回りました。

Claude 3.5 Sonnetベンチマーク比較結果

その後、今年 10 月に、Anthropic 社はアップグレード版の Claude 3.5 Sonnet と、最新かつ最速のモデルである Claude 3.5 Haiku を発売しました。

アップグレードされたClaude 3.5 Sonnetは、複数の業界ベンチマークにおいて包括的な改善を示しました。コーディングに関しては、Claude 3.5 SonnetはSWE-Bench Verifiedのパフォーマンスを33%から49%向上させ、公開されているすべてのモデルのスコアを上回りました。アップグレードされたClaude 3.5 Sonnetは、革新的な新スキル、つまりコンピューターを人間のように操作する能力を獲得し、この機能は生成AIへの新たな関心の波を引き起こしました。

Anthropic が Claude を継続的にアップグレードする背景には、Amazon Web Services との連携も深化していることがあります。

2023年9月、Amazon Web ServicesはAnthropicに大胆な投資を​​行い、記録的な40億ドルを投資しました。

投資時に開示された情報によると、AmazonとAnthropicの協力には、AmazonがAnthropicに40億ドルを投資して同社の株式を取得すること、AnthropicがAmazon Bedrockを通じて世界中のAmazon Web Servicesの顧客に将来の基礎モデルへのアクセスを提供するという長期的なコミットメント、Amazonの開発者とエンジニアがAmazon Bedrockを通じてAnthropicのモデルを使用して製品を構築し、それによって生成AI機能を仕事に統合できることが含まれる。

それ以来、Claude 3シリーズからClaude 3.5シリーズに至るまで、すべての新しいClaudeモデルは発売と同時にAmazon Bedrockで利用可能になりました。Amazon Bedrockのお客様は、これらの最新の主要モデルを使い慣れたクラウド環境で利用できるため、イノベーションのスピードが大幅に加速します。

大型モデルである Anthropic シリーズのサポートにより、Amazon Bedrock の「モデル ライブラリ」が大幅に充実しました。

アマゾンはこの40億ドルの投資で正しい賭けをした。

80億ドルで「一流」の地位を固める

40億ドルの追加投資とさらなる協業について、アマゾン ウェブ サービスCEOのマット・ガーマン氏は次のように述べています。「アンスロピックの基礎モデルを用いてAmazon Bedrock上で生成AIアプリケーションを開発しているお客様からは、好意的なフィードバックをいただいています。アンスロピックのイノベーションのスピードと責任ある生成AIへの取り組みに感銘を受けており、アンスロピックとのパートナーシップをさらに深めていくことを楽しみにしています。」

アンスロピックの共同創業者兼CEOであるダリオ・アモデイ氏は、「クロードにとって今年は飛躍の年となりました。Amazonとのパートナーシップは極めて重要であり、クロードのモデルをAmazon Bedrock上の数万人の顧客、そして数百万人のエンドユーザーに届けることができました」と述べています。

Amazon Web Servicesの最新財務報告も、この「win-win」の状況を反映しています。AI事業の急成長の恩恵を受け、Amazon Web Servicesの売上高は今年第3四半期に274億5,200万ドルに達し、前年同期比19%増、営業利益は104億4,700万ドルに達し、前年同期比19%増となりました。

40億ドルの投資を伴うこの新たな協業サイクルにおいて、両社は独自チップの開発におけるパートナーシップについて具体的に協議しました。Anthropicは、Amazon TrainiumとAmazon Inferentiaチップを用いて、将来の基礎モデルの学習と展開を計画しています。Amazon Web Services(AWS)はAnthropicと連携し、カスタマイズされたAmazon Trainiumチップを開発することで、生成AI技術の応用範囲を継続的に拡大しています。

Amazon Web Servicesが自社開発するチップであるAmazon Trainium 2チップは、2023年にリリースされ、パフォーマンスとエネルギー効率を大幅に向上させ、大規模な分散トレーニングタスクに適応し、クラスターにおいてスーパーコンピューティングレベルのパフォーマンススケーリングを実現します。Amazon Trainium 2は、Amazon EC2 UltraClustersで最大10万個のチップまで拡張可能で、ペタバイト規模のAmazon Elastic Fabric Adapter(EFA)ネットワークを介して相互接続することで、最大65エクサフロップスの演算能力を提供します。このレベルのパフォーマンスにより、お客様は3,000億個のパラメータを持つ大規模な言語モデルを、数か月ではなく数週間でトレーニングできます。

Amazon Inferentiaは、Amazon Web Servicesが推論専用に設計したチップです。Amazon Inferentia2チップは推論タスクのコストを40%削減できると報告されており、特にリアルタイム推論を必要とする大規模モデルの導入に適しています。

Anthropicへの今回の40億ドルの投資には、2つの目的があります。第一に、Amazon Web Services(AWS)のお客様にAnthropicモデルへの長期的な「ファーストクラス」チケットを提供し、Amazon Bedrockを通じて最新モデルに即座にアクセスできるようにします。第二に、Amazon TrainiumとAmazon Inferentiaチップを用いた基礎モデルのトレーニングと展開において、両社間の新たな協業の道を開き、大規模モデルアプリケーションにおけるコスト削減と効率性向上の可能性を高めます。(Guo Qing)