|
12月23日、百川知能はフルチェーンのドメイン拡張型大規模モデル「百川4-Finance」をリリースしました。高品質な金融データに基づき、業界初のドメイン自己制約型トレーニングスキームを採用した百川4-Financeは、金融機能と一般機能の同時向上を実現し、金融シナリオ全体のユーザビリティを大幅に向上させます。 Baichuan4-Finance は、金融の専門知識とアプリケーション シナリオにおいて GPT-4o を 20% 近く上回り、中国人民大学金融学院が新たにリリースした評価システム FLAME と、中国で主流のオープン ソース金融ベンチマークである FinancelQ でトップを獲得しました。 報道によると、Baichuan4-Financeは、効率性の向上、リスク管理とコンプライアンス、顧客サービス、意思決定支援など、金融業界に様々な側面で包括的な価値向上をもたらすことができます。Baichuan4-Financeは、書類審査、顧客相談、商品マーケティングなど、金融専門家が日常的に行う膨大な業務を支援します。また、深い金融専門知識と法令遵守の理解に基づき、金融機関に正確なリスク特定とコンプライアンス保証を提供します。さらに、強力なデータ分析機能を通じて、経営陣に専門的な市場洞察と意思決定アドバイスを提供します。 現在、Baichuan4-Finance API は Baichuan Intelligent ウェブサイトで正式にリリースされています。 全体的な精度は GPT-4o より 20% 近く高く、複数の金融ベンチマークで 1 位にランクされています。 FLAME(Financial Large-Language Model Assessment and Metrics Evaluation)は、中国人民大学金融経済学院が12月17日にリリースした財務評価システムです(GitHubアドレス:https://github.com/FLAME-ruc/FLAME/tree/main)。 金融分野における最新の評価システムであるFLAMEは、専門性と実用性を両立させ、2つの評価ベンチマークで構成されています。FLAME-Cerは、主にモデルの専門的な金融能力を評価し、CPA、CFA、FRMなど14の権威ある金融資格を網羅しています。一方、FLAME-Sceは、10の主要なコア金融ビジネスシナリオ、21の金融ビジネスシナリオのサブセクター、そして約100の三次金融アプリケーションタスクなど、様々なシナリオにおけるモデルの応用能力に焦点を当てています。 FLAME-Cerによる評価結果によると、Baichuan4-Financeは銀行、保険、ファンド、証券など複数の認証分野で95%を超える精度を達成し、総合精度は93.62%でした。これはGPT-4oやXuanYuan3-70B-Chatを大きく上回り、GPT-4oを20%近く上回っています。GPT-4oは金融分野における最も強力な汎用モデルの1つとして広く認められており、XuanYuan3-70B-Chatは中国初のオープンソースの中国金融モデルです。 FLAME-Sce 評価では、Baichuan4-Finance は主要な中核金融ビジネス シナリオで全体的な可用性率が 84.15% を達成し、金融データ計算や金融知識理論などのシナリオの可用性率は 90% を超え、実際のアプリケーションで優れたパフォーマンスを発揮しました。 さらに、中国で主流のオープンソース金融ベンチマークであるFinanceIQでは、Baichuan4-FinanceはGPT-4oとXuanYuan3-70Bも上回り、総合精度は79.23%となり、GPT-4oを13%近く上回りました。 先駆的なドメイン固有の自己制約トレーニング スキームにより、モデルの金融固有の機能と一般的な機能が同時に強化されます。 大規模モデルを特定のシナリオに展開する上で、汎用性を犠牲にすることなく、モデルの専門性を高めることが最大の課題です。この課題に対処するため、BaiChuan Intelligenceは、高品質なデータセットの構築、モデルの事前学習、微調整、強化学習など、モデル開発から応用までの全プロセスをカバーするフルチェーンのドメイン拡張ソリューションを開発しました。 モデルトレーニングフェーズにおいて、Baichuan Intelligenceは業界初のドメイン固有の自己制約型トレーニング技術を活用し、専門モデルと汎用モデルの両方の能力を同時に向上させ、多様なシナリオにおけるモデルの有用性を大幅に向上させました。Baichuan4-Financeはこのソリューションの最新成果であり、エンドツーエンドの金融ドメイン強化により、金融理論の確固たる基盤と、複数のシナリオにわたる豊富な実用的アプリケーション能力の両方を備えています。 具体的には、Baichuan4-Finance の高品質な金融データセットは、金融の教科書や学術論文、トップの金融ジャーナル記事、規制政策文書、金融法規制などの主要な専門金融知識データ、および金融 Q&A セット、企業の財務報告書や年次報告書、金融調査分析レポートなどの実用アプリケーションデータを含み、包括的かつ厳密であり、モデルの金融機能を向上させるための優れた基礎サポートを提供します。 これを基に、Baichuan4-Finance はより高精度の一般データをドメイン自己制約トレーニングプロセスに導入し、高品質の金融データとの混合トレーニングを実施することで、最終的にモデルの一般機能を維持しながら金融機能を着実に向上させる効果を達成しました。 さらに、Baichuan Intelligence は、データと指示データを合成してモデルを監督する、強化学習戦略では数学計算などの金融分野で特に興味深いシナリオのサンプル拡張を実行するなど、トレーニング後の段階で多くの機能強化作業を行っており、モデルのパフォーマンスをさらに向上させています。 金融機関が大規模モデルを様々な実世界のシナリオに適用できるよう、百川知能は公式ウェブサイトで百川4金融のエンドツーエンドのドメイン拡張に関する技術レポートを公開し、「ドメイン自己制約トレーニング」を含む様々な技術的側面を詳細に解説していることも特筆に値します。この動きは、金融業界における大規模モデルの理解を大幅に深めるだけでなく、金融機関の大規模モデル導入能力と導入意欲を効果的に向上させるでしょう。 百川智能は、ノーテルデジタル、パーフェクトワールドゲームズ、iQiyi、360グループ、盛学教育、愛学堂など、様々な業界のリーディングカンパニーを含む数千社の顧客にサービスを提供してきたと報じられています。また、Xinyada、Yonyou、iSoftStone、Xinzhi Software、Daguan Data、Huasheng Tianchengといった多くの業界エコシステムパートナー、HuaweiやSugonなどのハードウェアメーカー、China Mobile、China Telecom、China Unicomなどの通信事業者と提携し、百川ビッグモデルエコシステムを共同で構築しています。 |
Baichuan Intelligence は、バリュー チェーン全体をカバーする強化された大規模金融モデルである Baichuan4-Finance をリリースし、GPT-4o よりも約 20% 高い全体的な精度を達成しました。
関連するおすすめ記事
-
Apple、iOS 18.4 ベータ 1 アップデートの一部を緊急撤回。iPhone 12 などのデバイスでは、アップグレード後に無限に再起動する問題が発生。
-
Xiaomi SU7で車軸破損が発生したが、同社は品質問題ではないと否定。ネットユーザーらは運転手の奇妙な動機について激しく議論している。
-
2025年世界トップ100自動車ブランド発表:中国ブランド24社が選出
-
Apple の幹部が自社開発の C1 ベースバンドについて語る: 私たちは、本当にユニークな利点を持つテクノロジーを構築していると信じています。
-
2024年北京北池マラソンは無事に終了しました。
-
Google:AI概要機能は来年、さらに多くの国と言語で利用可能になる予定です。