|
iFlytekは1月15日、中国製コンピューティングプラットフォームで現在利用可能な唯一の深層推論モデルであるiFlytek Spark X1をリリースしました。このモデルは中国最高水準の数学性能を誇り、まずは教育や医療といった重要なシナリオに適用されています。 一方、iFlytek Spark 4.0 Turboプラットフォームの機能は再びアップグレードされ、画像とテキスト、数学と長文の機能が大幅に向上し、混合ドメイン知識検索テクノロジーが導入され、業界と企業の悩みの種がさらに解消されました。 さらに、iFlytekは、中国のインテリジェント翻訳分野のリーダーとして、エンドツーエンドの音声対音声の同時通訳機能を備えた業界初の大規模モデルであるSpark Voice同時通訳大規模モデルを発表しました。このモデルは、最速の音声同時通訳の遅延が5秒未満です。 01 iFlytek Spark X1 は、中国で最高の中国語数学機能を誇ります。 現実世界のシナリオで初めて実装 iFlytek Sparkは、常に純国産アプローチを貫いてきました。純国産コンピューティングプラットフォーム上で深層推論モデルの学習を行う上で、数々の課題に直面しましたが、iFlytekはファーウェイとの協力により、高いインタラクティブ性を備えた推論の学習、高スループット推論の最適化、国産オペレーターの最適化など、一連の困難を克服しました。そして最終的に、純国産コンピューティングパワーをベースに、深層思考・推論機能を備えた中国初の大規模モデル、iFlytek Spark X1の学習に成功しました。 記者会見では、iFlytek研究所の研究者がiFlytek Spark X1を用いて、大学入試問題、AIMEコンテスト問題、高校オリンピック問題を解くパフォーマンスを実演しました。iFlytek Spark X1は、これらの問題に正確に解答を提供するだけでなく、問題解決の戦略と手順を詳細に分析しました。一般的な大規模モデルと比較して、その問題解決プロセスは人間の「スローシンキング」アプローチに近いものでした。 このプロセスで、iFlytek Spark X1 は、複雑な問題をより単純なステップに分解することで複雑さを簡素化すること、自己探索と反省検証を実行すること、そして答えが正しいかどうかに関する高品質のフィードバック情報に基づいてトレーニングを強化することという、ディープラーニング モデルの典型的な 3 つの特性を完全に実証しました。 特筆すべきは、iFlytek Spark X1が、小中学校(競技会を含む)、大学(競技会を含む)、AIME、MATH 500など、最近の数々の「試験」で優れた成績を収めていることです。少ない計算能力で業界をリードする結果を達成しており、多くの指標が中国で最高となっています。 「大規模モデルの開発、応用が鍵」というのが、iFlytekが一貫して掲げてきた見解だ。 現在、iFlytekのSpark X1は、実世界の教育現場での導入に成功しています。昨年10月24日、iFlytekは中国教育科学院と共同で、「問題連鎖」に基づく高校数学向けのスマート教師アシスタントを発表しました。同時に、全国数百のパイロット地域と連携し、数千人の優れた教育研究者や教師と協力し、数万件に及ぶ優れたケーススタディを作成しています。Spark X1はすでにこれらのパイロット地域に導入され、高い評価を得ています。体験した教師からは、単一の問題に対する複数の解決策の提示、教育知識の連携、生徒の高次思考の拡張といった分野でX1が非常に優れたパフォーマンスを発揮するとの声が上がっています。iFlytek Spark X1は、生徒や保護者にとっても役立つツールとなるでしょう。関連技術とのより深い統合により、iFlytekのAI学習マシンは、より正確な学習推奨と診断、そしてより明確な問題解決戦略と知識連鎖を提供し、今後もアップグレードが続けられます。 医療分野では、iFlytek Spark X1のモデル戦略が初期の成功を収め、専門的な補助診断と複雑な医療記録の品質管理の両方で90%の精度を実現しました。iFlytekは記者会見で、今年上半期にiFlytek Spark X1をベースとした医療ビッグデータモデルのアップグレード版を正式にリリースし、その深層診断推論効果と品質管理能力が業界をリードすることを確実にすると発表しました。 02 iFlytek Starfire 4.0 Turbo ドックの機能がさらにアップグレードされました。 業界をより深く理解する、より大きなモデルになる 今回の発表イベントでは、iFlytekのSpark 4.0 Turboプラットフォームが全面的にアップグレードされ、7つのコア機能が包括的に強化され、OpenAIの最新のGPT-4oに完全準拠しました。このアップグレードの最も重要な特徴は、業界や企業の課題解決に重点を置き、数学的処理、業界知識、画像・テキスト認識、長文テキスト処理の能力を向上させていることです。 数学的機能はiFlytek Sparkの強みの一つです。iFlytek Spark X1の高品質な合成データに基づき、iFlytek Spark 4.0 Turboの数学的機能はさらに強化され、数学教育、金融分析、科学研究においてユーザーをより効果的に支援します。 画像・テキスト認識機能は、企業が業界およびプライベートドメインのデータを効率的に収集、編集、活用する能力に直接関係しており、大規模モデルの「学習」の基盤となります。様々な業界の実務において、企業は画像・テキスト認識における困難な問題に頻繁に直面します。例えば、健康診断報告書、裁判文書、学術論文、企業契約書といった文書に加え、複雑で長い表、乱雑なレイアウト、手書きの数式、印鑑付きの手書き契約書、傾いた線や欠けた線などです。iFlytek Spark 4.0 Turboの画像・テキスト認識機能は、一般的な文書のレイアウト解析とテキスト認識の精度を40%、複雑な表構造や判読しにくい手書き文字の精度を60%向上させ、これらの問題を解決し、高価値データの取得能力を大幅に向上させました。比較テストでは、iFlytek Spark 4.0 Turboの画像・テキスト認識機能が、国内外のトップ競合製品を大幅に上回っていることが示されています。 今回のアップグレードでは、文書要素の検出機能も強化され、知識のセグメンテーションと構築においてより緻密で正確な粒度を実現し、大規模モデルの錯覚を効果的に防ぎます。また、文書のスキャンと解析のための高速バージョンもリリースされ、文書理解速度が10倍以上向上しました。500ページのプロジェクト文書の場合、スキャンと認識から解析までの全プロセスをわずか2分で完了できます。 大規模モデルを用いた長文処理能力は、ユーザーにとって常に重要な焦点であり、特にエンタープライズ知識ベースの質問応答のような厳格なアプリケーションシナリオでは、「大規模モデル錯覚」に対するユーザーの許容度は事実上ゼロです。そこで、iFlytek Sparkは、インテリジェントエージェントをベースとした新しい長文テキストフレームワークを発表し、業界で初めて文レベルのソーストレース機能を提供します。この新しいフレームワークは、超長文アテンションメカニズムを最適化し、大規模なウェブページや書籍データを用いた知識連想合成により、知識応答のエラー率を40%削減します。文レベルのソーストレース性能はGPT-4oを凌駕し、「大規模モデル錯覚」のために繰り返しソーストレースの確認が必要となる質問応答検索サービスにおけるアプリケーション展開の課題を大幅に軽減します。 多くのユーザーがレポート作成や調査を行う際に、情報の収集と整理に多大な時間を費やしていることを踏まえ、iFlytek Sparkは、テキスト、画像、長文といった高度な検索機能と、蓄積された業界アプリケーションの経験を活かし、初のクロスドメイン・ナレッジ検索技術を発表しました。この技術により、個人の知識、企業の知識、業務システムデータ、高品質な業界データ、インターネット情報などを包括的に検索することが可能になります。ユーザーはたった一つの質問をするだけで包括的な検索結果が得られ、情報検索の効率が大幅に向上します。 第三者データによると、iFlytek Sparkは2024年に、特にエネルギー、金融、自動車、通信事業者などの業界で、大規模モデルの入札件数と落札額の両方で「ダブルファースト」を達成し、顧客と協力して100近くのインテリジェントエージェントアプリケーションを改良しました。 「技術+応用」の継続的な好循環に基づき、iFlytek Spark 4.0 Turboは産業能力を全面的に強化しました。金融、石油・ガス、エネルギー、電力、鉄鋼、航空などの分野における総合能力の絶対値向上はいずれも10%を超え、「最も産業に精通した大型モデル」と言えるでしょう。 03 Sparkから同時音声通訳の初の大規模モデルがリリースされました。 すべての製品の翻訳機能を強化 iFlytekは、中国のインテリジェント翻訳分野のリーダーとして、業界で初めて国家翻訳専門資格試験に合格した機械翻訳システムを誇るだけでなく、IWSLT国際口語英語機械翻訳コンテストで3年連続優勝を果たしています。記者会見では、iFlytekはインテリジェント翻訳分野における新たな躍進を発表しました。Spark Voice同時通訳大型モデルは、エンドツーエンドの音声同時通訳機能を備えた中国初の大型モデルで、日常会話、ビジネス交流、業界翻訳など、国際的なコミュニケーションシーンにおける高難易度の同時通訳ニーズに対応するためにリリースされました。 周知の通り、同時音声通訳は技術的に困難です。「現在、大規模モデル機能の開発と、iFlytek独自のインテリジェント音声技術におけるアルゴリズムの蓄積を組み合わせることで、エンドツーエンドの同時音声通訳が可能になりました。」このモデルは、人間の同時通訳者の思考プロセスを模倣して学習され、意味のグループをリアルタイムで理解・分割し、文脈から正確に単語を選択し、断片化された情報を再構成する能力を備えていると理解されています。この特性により、Spark同時音声通訳大規模モデルは複雑な文章や文脈を扱う際に優れたパフォーマンスを発揮し、元の意味を迅速かつ正確に伝えることができます。 技術テストの結果、iFlytekの音声同時通訳技術は、海外の優良な競合他社の逐次通訳技術と比較しても、コンテンツの完全性、情報の正確性、言語品質においてトップレベルにあることが示されました。同時に、Spark音声同時通訳ビッグモデルは、わずか5秒の同時通訳遅延を実現し、人間の専門通訳者と同等のレベルに達しています。 最新の同時通訳技術を搭載した製品はどれほど優れたパフォーマンスを発揮するのでしょうか?iFlytek Translatorの製品マネージャーがデモンストレーションを行いました。海外旅行での観光名所紹介から国際展示会での専門製品のプレゼンテーションまで、この翻訳機は高品質な英語から中国語、中国語から英語への双方向同時通訳を短時間で完了できます。 Spark同時音声通訳ビッグデータモデルは、エンドツーエンドの音声同時通訳機能に加え、音声テキスト翻訳の品質も向上させ、iFlytek製品全体の翻訳機能を大幅に強化しました。日常会話、単独スピーチ、映画やテレビ番組、より複雑なシナリオと高い翻訳難易度を伴う複数人会議、医療などの専門分野など、様々な国際コミュニケーションシーンにおいて高品質な翻訳サービスを提供します。 記者会見の最後に、iFlytekは、音声同時通訳のシナリオ向けに、iFlytek Translatorにヘッドフォン、スピーカー、マイクが搭載され、さまざまなビジネス交渉シナリオにおけるユーザーのニーズを満たすビジネスキットが2025年に発売されることを明らかにした。(Suky) |
業界唯一!iFlytekは、完全国産のコンピューティングパワーをベースにした初のディープラーニング推論モデルX1をリリースしました。
関連するおすすめ記事
-
日本における純電気乗用車の販売は4年ぶりに減少し、BYDの販売がトヨタを上回った。
-
報道によると、フォルクスワーゲンの経営陣は給与削減に直面しており、ボーナス削減により今後2年間で10%の給与削減につながる可能性がある。
-
Tencent Yuanbao が「不公平な条件」を含むユーザー契約に応答: 皆様のフィードバックを受け取りました。ご批判とご監督に感謝いたします。
-
オープンソースのルーティングシステムであるOpenWrtは、高リスクのセキュリティ脆弱性を緊急に修正しました。攻撃を防ぐため、ユーザーはできるだけ早くアップデートとアップグレードを行うことをお勧めします。
-
NetEase が Blizzard 復帰後初の財務報告を発表。World of Warcraft と Hearthstone が記録を更新。
-
Dimensity 8400 モバイル チップがリリースされ、ハイエンド スマートフォン向けのオールビッグ コア コンピューティングの時代が到来しました。