SHOUJIKE

あらゆる面で新たなフラッグシップモデルとなったYi-Lightningは、GPT-4oを凌駕する。Kai-Fu Leeがその理由を解説する。

10月16日、Zero1WorldのCEOである李開復氏は、大規模なモデルの事前トレーニングは行わないという噂を否定し、最新のフラッグシップモデルであるYi-Lightningを正式にリリースした。

国際的に権威のあるブラインドテストランキングリストLMSYSにおいて、Yi-LightningはOpenAI GPT-4o-2024-05-13やAnthropic Claude 3.5 Sonnetなどのシリコンバレーの有名モデルを上回り、世界第6位、中国第1位にランクされました。

これはまた、ZeroOne が xAI と同等に OpenAI と Google に追随し、世界トップ 3 のモデル企業になる準備ができていることを意味します。

Yi-Lightningは現在、Yi Large Model Open Platform(https://platform.lingyiwanwu.com/)で利用可能で、100万トークンあたりの価格はわずか0.99元です。

リー・カイフー氏は改めてこう述べた。「ゼロワンウェイは大規模モデルの事前トレーニングを決して諦めません。当社の事前トレーニングは高速かつ優れています。」

Yi-Lightningのビッグモデルに加え、Zero-One-WayのTo Bインダストリーソリューションであるインダストリーアプリケーション製品「AI 2.0 Digital Human」もリリースされました。小売やECなどのシナリオに焦点を当て、最新のフラッグシップモデルをインダストリーソリューションに適用しています。弾幕インタラクション、商品情報抽出、リアルタイムスクリプト生成といった分野では、AI 2.0 Digital HumanがYi-Lightningと統合されています。

現時点で、ゼロワン・エブリシング・グランドモデルはTo CとTo Bの両セクターで製品を発売しています。李開復氏は、To CとTo B戦略の焦点の違いについても詳細な分析を行いました。

李開復氏の視点:

1. 大規模モデルの事前トレーニングを決してあきらめないでください。米国より 6 か月遅れていることを恥ずべきことだと考えないでください。

記者会見で李開復氏は「一部の自主メディアは、中国の6大モデル企業のうち数社が大型モデルの事前訓練を断念したと主張しており、中国の事前訓練は米国に追いつけないという意見もネット上に多くある」と改めて強調した。

李開復氏は再び正式に噂を否定した。「ゼロワンシングスは事前訓練を決して放棄しません。私たちの事前訓練は速くて優れています。」

李開復氏は、中国は大規模モデルの事前学習において米国に遅れをとっており、10年、あるいは20年遅れているという見方もあると述べました。今日では、非常に正確な数値が用いられています。GPT4oは5月13日に開発され、Yi-Lightning大規模モデルは10月16日にそれを上回りました。つまり、中国は5ヶ月後に、その5ヶ月前の最強モデルを上回ったのです。中国が米国に追いつくまでの距離を判断するには、Yi-Lightningモデルが追いつくまでに少なくとも5ヶ月かかるでしょう。

李開復氏は、米国に6か月遅れていることを決して恥ずべきことと考えるべきではないと強調しました。私のアメリカ人の友人の多くは、中国は大きく遅れをとると考えています。また、中国の友人を含む一部のアメリカ人の友人は、このまま10万台のGPUで推移すれば、3年、5年、あるいは10年も遅れをとる可能性があると考えています。しかし、Zero-One-Wayは、それほど大きく遅れをとることはないことを証明しました。また、他の2つの中国企業も今回はLMSYSのリーダーボードで好成績を収めました。私たちだけが遅れをとっているわけではありません。

李開復氏の見解では、優れた事前学習済みモデルの作成は、チップ、推論、インフラ、そしてモデルを理解した人材と、優秀なアルゴリズムエンジニアの連携を必要とする高度な技術を要する作業です。すべての企業がこれを実行できるわけではなく、コストも比較的高額です。今後、大規模なモデル開発企業が事前学習に取り組むことはますます少なくなるでしょう。

さらに、李開復氏は、Yi-Lightningの事前学習にはわずか2,000基のGPUを使用し、学習に1ヶ月半を要し、300万ドル以上の費用がかかったことを明らかにした。事前学習済みモデルの性能はxAIのGrokと同等だが、コストはGrokの1~2%にとどまった。

2. 当社は価格競争をしたり、損失を出すような事業は行いません。API 価格が「激安」であっても、わずかながら利益は出ます。

今回、あらゆるものに対する最も強力なモデルである Yi-Lightning の API 価格は、100 万トークンあたりわずか 0.99 元です。

この価格について、李開復氏は「このモデルを赤字で販売するつもりはありませんが、大儲けするつもりもありません。その代わりに、原価にわずかな利益を上乗せし、今日の価格は100万トークンあたり0.99元です。どなたでもお気軽にご利用ください。ご利用によって当社が倒産する心配はございません。」と述べた。

同時に、李開復氏は「以前、業界の価格競争について質問した際、ゼロワンワールドは価格競争には参加しないと答えました。また、当時はモデルの価格だけでなく、モデルの性能が十分かどうかも考慮する必要があるとも述べました」と繰り返した。

新しいフラッグシップモデル「Yi-Lightning」の強みは何ですか?

ゼロワンウェイが今年上半期に発表した数千億のパラメータを持つYi-Largeモデルに続き、最新フラッグシップモデルYi-Lightningが国際的に権威のあるブラインドテストリストLMSYSでGPT-4o-2024-05-13やClaude 3.5 Sonnetを上回り、世界6位、中国1位にランクされました。

大規模モデルが競い合う世界的な舞台であるLMSYSのオープンステージで、初めて「OpenAI GPT-4oを上回る」という最高の成績を収めたほか、中国の大規模モデルもこの偉業を達成した。

Yi-Lightning は、さまざまなサブランキングでも非常に優れたパフォーマンスを発揮しました。

中国ランキングでは、Yi-LightningはxAIがリリースしたGrok-2-08-13やZhipuがリリースしたGLM-4-Plusなど国内外の高品質モデルを上回り、o1-miniなどのモデルと世界第2位を分け合った。

マルチラウンドダイアログリーダーボードでは、Yi-LightningはGoogleのGemini-1.5-ProやAnthropicのClaude 3.5 Sonnetなどの有名なフラッグシップモデルを上回り、3位にランクされました。

数学とコーディング能力においても、Yi-Lightningは世界トップクラスです。数学とコーディングのサブランキングでは、それぞれ3位と4位にランクインしました。

Yi-Lightning は、専門性と難しさで知られる難問と長い問題のリストで優れたパフォーマンスを維持し、両方のカテゴリーで世界第 4 位という素晴らしい成績を達成しました。

LMSYS Chatbot Arenaのユーザーエクスペリエンス評価は、Yi-Lightningの卓越したパフォーマンスを実証するだけでなく、大規模モデルが現実世界の課題を解決する能力をより直感的に検証しました。これは、Yi-Lightningの優れたモデルパフォーマンスを証明するだけでなく、さらに重要な点として、Yi-Lightningが実験室シナリオからシミュレートされた現実世界のユーザーシナリオへとスムーズに移行できることを意味し、モデル機能のより迅速かつ高品質な展開を可能にします。

さらに、Yi-Large と比較して、Yi-Lightning は推論速度が大幅に向上し、モデルのパフォーマンスがさらに向上します。

社内評価データによると、8xH100のコンピューティング能力を持ち、同じタスクスケールでテストした場合、Yi-Lightningの最初のパケット時間(タスク要求を受信して​​からシステムが応答結果の出力を開始するまでの時間)はYi-Largeの半分になり、最大生成速度も約40%向上しました。

大規模モデルは、B2B 市場と B2C 市場の両方に適用する必要があります。

国内の大型模型レース産業は急成長の2年目に入り、商品化による収益力は各方面の注目の的となっている。

01Worldは本日、新たなTo B戦略に基づく初の業界応用製品「AI 2.0 デジタルヒューマン」を発表しました。小売やeコマースといったシナリオに焦点を当て、最新のフラッグシップモデルを業界ソリューションに適用しています。AI 2.0 デジタルヒューマンは、Yi-Lightningと連携し、バレットスクリーンインタラクション、製品情報抽出、リアルタイムスクリプト生成といった分野で活用されています。

報道によると、Yi-Lightningとの連携後、デジタルヒューマンのリアルタイムインタラクティブ効果が向上し、対話がよりスムーズになり、応答もより正確になったとのことです。ビジネスデータの観点から見ると、あるホテル・旅行会社のGMV(流通総額)は、Yi-Lightningの新機能とデジタルヒューマンのライブストリーミングを連携させた後、以前と比べて170%増加しました。

李開復氏は、大企業がB2BとB2Cの両セクターを同時に展開するのは非常に困難であり、両チームの背景、業務方法、KPI測定方法が異なるため、多様なマネジメントアプローチが求められると述べた。「私は両方の分野で経験を積んでおり、実現に向けて努力していますが、全てをこなすことは絶対に不可能です」と付け加えた。

B2B戦略を国内市場に注力するという決定について、李開復氏は次のように述べています。「小売やケータリングにおけるデジタルヒューマンの活用など、包括的なソリューションを提供できる画期的な機会がいくつか見つかりました。他にも2、3の分野に取り組み始めていますが、詳細はまだ公表できません。米国などの海外市場のユーザーへのリーチは難しいため、B2B事業は中国国内でのみ展開しています。そのため、海外B2B戦略は断念しました。国内市場では、模型販売やプロジェクトベースの業務ではなく、収益性の高いソリューションを提供することに重点を置いたB2Bアプローチを採用しています。これがZeroOneThingsのB2B戦略の核心です。」

ToCプラットフォームであるZero One Thingsは、主に海外市場に焦点を当てています。李開復氏は、ToC製品は中国におけるユーザー獲得において大きな課題に直面していると考えています。それは、ユーザー獲得コストが急上昇していることです。一部の競合他社は、ユーザー獲得コストを10元から30元程度まで引き上げており、最近ではユーザーの離脱も顕著です。このような厳しい環境において、私たちは非常に慎重に行動します。当面は、中国で新し​​いToCアプリをリリースする予定はありません。既存製品は引き続き維持しますが、海外でより低コストで質の高いユーザーを獲得することに注力します。あるいは、海外ではサブスクリプションの習慣がより一般的であるため、アプリを直接販売し、ユーザーがサブスクリプション料金を支払えるようにすることも可能にします。現在、Zero One Thingsの収益化能力とユーザー獲得コストは、海外のToC製品にとって費用対効果が高いです。その後、中国でToC製品をリリースする機会を注視していきます。

李開復氏は、ToCかToBかを問わず、TC-PMFを事前に予測することは避けられない中核課題であると強調しました。モデルの性能と推論コストは、大規模モデル展開の成否に直接影響する重要な要素です。性能と費用対効果を兼ね備えた新たな主力モデルであるYi-Lightningは、01wx.comの「モデルとアプリケーションの統合」の探求においても重要な礎石となるでしょう。01wx.comは「モデル + AIインフラ + アプリケーション」というフルスタックのレイアウトを堅持し、ToBエンタープライズレベルのソリューションにおけるTC-PMFを積極的に探求し、AI for Allの時代をより自信を持って迎え入れていきます。(郭青)