SHOUJIKE

Baidu の Wenxin ビッグデータ モデルがオープンソース化される。Robin Li 氏の考えは変わったか?

2月14日、昨日のWenxin Yiyanの無料提供発表に続き、Baiduは本日、Wenxin Big Model 4.5シリーズが今後数か月以内にリリースされ、6月30日に正式にオープンソース化されるという、もう一つの重大発表を発表しました。

Wenxin Big Model は、Baidu が独自に開発した知識強化型ビッグ言語モデルであり、モダリティや言語を超えた深い意味理解と生成を実現する機能を備えています。

国内大型模型分野の主要プレーヤーとして、Baidu がその最も強力な Wenxin 大型模型バージョン 4.5 をオープンソース化することは、間違いなく国内大型模型業界に利益をもたらすでしょう。

業界においては、「DeepSeek効果」が依然として続いています。大規模モデル開発におけるオープンソースとクローズドソースのアプローチをめぐる議論は、オープンソースの勝利で終結したようです。

Baidu が大規模なクローズドソース モデルの開発を開始したのはいつですか?

実際、Baidu は当初、クローズドソース モデルのアプローチを採用していませんでした。

2021年、百度はERNIEの事前トレーニング済みモデル4つをオープンソース化しました。これには、多粒度の言語知識強化モデルであるERNIE-Gram、長文理解モデルであるERNIE-Doc、シーングラフ知識を統合するクロスモーダル理解モデルであるERNIE-ViL、言語と視覚を統合するモデルであるERNIE-UNIMOが含まれます。

しかし、2023年3月、百度は「文心ビッグモデル3.0」を発表し、このモデルをベースにした生成AI製品「文心一眼」を発表しました。「文心一眼」は、国内大手企業が初めてリリースしたChatGPTのような製品であり、百度は一時期、比類のない成功を収めました。

この「先行している」という感覚こそが、百度の大規模なクローズドソースモデル戦略の種を蒔いたものだった。

2023年5月には百度は文心ビッグモデル3.5をリリースし、同年10月には文心ビッグモデル4.0をリリースした。

同時に、文心ビッグモデルをベースとした文心易眼も、2023年11月1日よりユーザー課金を開始しました。文心易眼プロフェッショナル版は、中国で初めて会員制を採用し、Cエンドユーザー向けに課金するビッグモデル製品となりました。プロフェッショナル版の価格は月額59.9元で、継続月額サブスクリプションは月額49.9元に割引されます。

無料ユーザーは Wenxin Large Model 3.5 を使用できますが、大規模モデルの上位バージョンを使用するには VIP になるために料金を支払う必要があります。

有料サービスにもかかわらず、文心易言のユーザー数は急速に増加しました。2023年12月、百度は文心易言のユーザー数が1億人を突破したと発表しました。

また、2024 年初頭には、大規模モデルにおけるオープンソースとクローズドソースの選択が、大規模モデルの分野で熱い議論の的となりました。

2024年4月11日、メディアは、ロビン・リーが社内講演で、文心ビッグモデルがオープンソースではない理由を初めて議論し、クローズドソースの多くの利点を挙げたと報じました。

Robin Li 氏は当時、1 年前に Wenxin Big Model が初めてリリースされたとき、Baidu 内で非常に白熱した議論があり、最終的に誰もがそれをオープンソース化しないことに決めたと明かしました。

「なぜオープンソース化しないのか? 当時の評価では、市場には間違いなくオープンソースモデルが存在し、複数の企業がそうするだろうとされていました。この状況では、百度がどの程度オープンソース化するかは関係ありません」とロビン・リー氏は述べた。

「今日、中国であれ米国であれ、最も強力な基本モデルはすべてクローズドソースであり、一方で、あらゆる種類の小規模モデル、つまり最良中の最良モデルは、大規模モデルから抽出されたものです。大規模モデルの次元削減によって作成されたモデルはより優れており、これもコストと効率の面でクローズドソースの利点につながっています」とロビン・リー氏は述べています。

ロビン・リーは、クローズドソースモデルが一時的な優位性ではなく、持続的に優位性を維持すると考えています。大規模なモデルをオープンソース化することはあまり意味がありません。クローズドソースモデルだけが、実行可能なビジネスモデルを確立し、収益を生み出すことができます。収益を生み出すことでのみ、コンピューティングパワーと優秀な人材を引き付けることができるのです。

当時、クローズドソース路線をとっていたのは百度だけでなく、米国では大規模モデル最強のOpenAIもGPT-2をリリースした後にクローズドソースに転向しました。2024年にはマスク氏から訴訟を起こされ、社名をClose AIに変更したことで嘲笑されました。

クローズドソースの大規模モデルにおける DeepSeek の革新的なリーダーシップは、ユーザーの購入決定によって実証されています。

しかし、2025 年の初めにすべてが変わりました。オープンソースの大規模モデルとして DeepSeek が登場し、クローズドソースの愛好家に大きな衝撃を与えました。

OpenAIのCEO、サム・アルトマン氏は、DeepSeekの登場により、OpenAIが過去数年間大きくリードしてきた状況が一変したことを認めた。アルトマン氏は、DeepSeekによってOpenAIのようなAI大手企業は、コスト、戦略、そして研究手法の見直しを迫られたと述べた。

最近の質疑応答で、アルトマン氏は「われわれは歴史の間違った側にいたと思う。異なるオープンソース戦略を開発する必要がある」と述べた。

OpenAIは迅速に対応し、2月6日にはChatGPT検索機能を登録不要ですべてのユーザーが利用できるようになることを発表しました。この機能は、2024年5月にChatGPT Plus加入者向けのアドオンオプションとして最初にリリースされました。2月13日には、OpenAIはGPT-5を無制限に無料で利用できることを発表しました。

DeepSeekはBaiduのCEOであるロビン・リー氏にも大きな影響を与えたと考えられている。

2月11日、アラブ首長国連邦のドバイで開催された「世界政府サミット2025」で、ロビン・リー氏はDeepSeekの出現が予想されていたかとの質問に対し、「イノベーションは計画できない。いつ、どこでイノベーションが起こるかは分からない。できるのは、イノベーションを促す環境を作ることだ」と答えた。

もちろん、ユーザーが足で投票することによる実際のプレッシャーもあります。

AI製品ランキングのデータによると、昨年12月から今年1月まで、DeepSeekだけでなく、Doubao、Kimi、Tongyi Qianwenなど中国の他の無料AI製品もWenxin Yiyanよりも人気がありました。

これらすべての要因により、Baidu は大規模な製品戦略の調整を余儀なくされ、無料およびオープンソースの提供が競争力を再構築する唯一の方法となった。

360の創業者である周紅義氏が12日のライブ配信で述べたように、おそらくそうだろう。「DeepSeekは無料であるだけでなく、オープンソースであり、その技術的秘密をすべて公開しています。そのため、DeepSeekは自社の進歩を促進するだけでなく、競合他社の進歩も促進します。人類がAGIへと向かう道のりにおいて、このような優れた共有メカニズムが必要です。車輪の再発明をすることなく、互いの成果を積み重ねることで、人類の進歩を加速させることができるのです。」(郭青)