SHOUJIKE

Baichuan Intelligent は、企業が「より速く、より良く、より安く」ビジネス モデルを実現できるよう支援する 1+3 製品マトリックスを備えたワンストップ ソリューションを開始しました。

百川知能は10月31日、大規模モデル向けのワンストップ商用化ソリューション、すなわち1+3製品マトリックス(チェーン全体にわたる高品質な汎用トレーニングデータ、Baichuan4-TurboとBaichuan4-Airの2つのモデル、そしてチェーン全体にわたるドメイン拡張ツールチェーン)を発表しました。このソリューションは「豊富なツール、高速、優れた結果、低コスト」を特徴とし、企業が最小限のコストで最適なプライベート展開を実現できるようにします。また、企業が自社データと百川知能のチェーン全体にわたる高品質なトレーニングデータを組み合わせ、Baichuan4-TurboとBaichuan4-Airモデルの最適化と強化を支援し、業界をリードする96%のマルチシナリオ可用性率を実現しています。

さまざまなシナリオにわたる企業の可用性率は 96% に達します。

よく知られているように、大規模モデルは優れた一般化能力を備えていますが、各企業は独自の専門知識と適用シナリオを持っています。汎用モデルをそのまま適用しても理想的な結果は得られません。モデルを特定のドメインやシナリオの要件に適応させるには、カスタマイズされた最適化が必要です。最適化されたモデルが複数のシナリオにわたってどれほど有用であるかは、その価値を評価する重要な基準です。以前は、企業固有のデータと汎用データを混在させ、汎用モデルのターゲットを絞ったチューニングと強化を行うのが業界の主流でした。しかし、さまざまな制限により、企業は元のモデルに近い汎用トレーニングデータを入手するのに苦労することがよくあります。そのため、最適化後もモデルは汎用性を失い、複数のシナリオに対応できない特化モデルになってしまう可能性が高くなります。

この重要な課題を解決するために、Baichuan Intelligence は、独自の高品質の事前トレーニング データ、SFT 微調整データ、強化学習の一般的なトレーニング データ、および自社開発の自動ハイパーパラメータ検索および調整テクノロジと動的適応型データ マッチング テクノロジを、統合された高品質の一般的なトレーニング データ ソリューションにパッケージ化しました。

Baichuan4-TurboとBaichuan4-AirはどちらもBaichuan Intelligenceが自社開発しているため、これらの高品質な汎用トレーニングデータは両モデルのデータ分布と高い整合性を備えています。ハイパーパラメータ動的探索や適応マッチングなどのアルゴリズムと組み合わせ、企業のプライベートデータで微調整することで、両モデルの複数のシナリオにおける可用性が大幅に向上しました。金融、教育、ヘルスケアなどのシナリオにおける専門サブタスクの平均可用性は96%と高く、業界トップクラスです。

Baichuan4-Turbo の導入コストと Baichuan4-Air の推論コストはどちらも業界最低です。

コストは、企業による大規模モデルの適用に影響を与えるもう一つの重要な要素です。企業は、様々なシナリオの様々な段階において、モデルの性能とコストに対する要件が異なります。業界ユーザーの多様なニーズにより適切に対応するために、Baichuan Intelligentは2つのモデルの位置付けを差別化しました。

具体的には、Baichuan4-Turboのコア機能(テキスト生成、知識ベースの質問応答、多言語処理など)は、Baichuan 4と比較して大幅に向上しています。導入には4090コアのコンピューティングパワーカード2枚のみで済むため、GPT-4oと同等の性能を持つモデルの中で最も低コストの導入モデルとなり、複雑なシナリオを検討している企業に最適です。一方、Baichuan4-Airは、大規模トラフィックを伴う既に検証済みのシナリオに適しています。その性能はBaichuan 4とほぼ同等ですが、推論コストは業界最安値で、Baichuan 4のわずか1%、100万トークンのコストはわずか0.98元です。

さらに、両モデルの応答速度が大幅に向上しました。Baichuan 4と比較して、Baichuan4-Turboは初動速度が51%、トークンフローが73%向上しました。Baichuan4-Airは初動速度が77%、トークンフローが93%向上しました。

注目すべきは、Baichuan 4-AirがBaichuan Intelligence初のMoE(Mixture of Experts)モデルとして、PRI(Pyramid, Residual, Interval)アーキテクチャの先駆者となったことです。標準的なMoEアーキテクチャと比較して、Baichuan4-AirはMLP(Multilayer Perceptron)とAttentionメカニズムの内部構造を維持し、ハイブリッドエキスパートMLP層の構成のみを最適化しています。エキスパートの数とアクティベーション戦略を合理的に設定することで、計算負荷のバランスを改善し、計算の複雑さを軽減し、推論速度を向上させます。同一の学習データを用いた場合、Baichuan4-AirはGPT4型およびMixtral型のMoEモデルよりも効率的であるだけでなく、大幅に優れた性能を発揮します。

Baichuan4-エアタイム効率比較テスト効果図

企業は、専門的なアルゴリズム人材の不足や、モデル展開時のモデル最適化における高い技術的障壁といった課題にも直面しています。これらの課題に対処するため、Baichuan Intelligenceは、ユーザーフレンドリーなエンドツーエンドのドメイン拡張ツールチェーンを開発しました。このツールチェーンは、データ取得、データクリーニング、データ拡張、モデルトレーニング、モデル評価、モデル圧縮、そしてモデル展開のためのツールを統合しています。企業は、暗号化モデルの展開とトレーニングにおいて、自社のニーズに合わせて適切なツールを自由に選択できます。

さらに、Baichuan Intelligent は多くの適応作業を通じてさまざまなハードウェアの互換性の問題を解決し、現在では NVIDIA 4090/A/H シリーズ、Huawei Ascend、Cambricon、Qualcomm、MTK、Tianshu などのさまざまな主流チップに効率的に適応できるようになりました。

報道によると、百川智能はすでに数千社の顧客にサービスを提供しており、その中にはノーテルデジタル、パーフェクトワールドゲームズ、iQiyi、360グループ、盛学教育、愛学堂など、様々な業界のリーディングカンパニーが含まれています。また、信易達、用友、iSoftStone、信智ソフトウェア、大観データ、華盛天成など、数多くの業界エコシステムパートナー、ファーウェイや曙光などのハードウェアメーカー、中国移動、中国電信、中国聯通などの通信事業者とも提携し、百川ビッグモデルエコシステムを共同で構築しています。(易悦)