|
リアルタイムインタラクティブクラウドサービスプロバイダーのAgoraは3月6日、あらゆる大規模テキストモデルを会話型マルチモーダルモデルにアップグレードできる会話型AIエンジンを正式にリリースした。 報道によると、Agoraの会話型AIエンジンは、DeepSeekやChatGPTを含むほぼすべての主要なグローバルモデルベンダーをサポートしています。また、主要なグローバル音声合成プロバイダー間のシームレスな切り替えを可能にし、開発者がこれらのプロバイダーによってカスタマイズされたカスタム音声を統合することを可能にします。 アゴラは、バリューチェーン全体にわたる徹底的な最適化と、中国、米国、欧州、東南アジアの主要都市での実世界テストにより、音声会話の遅延の中央値は650ミリ秒まで短縮されたと述べています。同時に、自社開発の「インテリジェント割り込み」技術は、実際の人間の会話のリズムをシミュレートし、AI会話をいつでも中断でき、応答時間は最短340ミリ秒です。 会場で行われたデモから判断すると、Agoraの会話型AIエンジンは基本的にリアルタイムで応答できます。「選択的注意ロック」機能は、周囲の人の声やノイズ干渉を95%遮断し、会話中の人の声を正確に識別できます。 さらに、会話型AIエンジンは、ネットワークの脆弱性やパケットロスに対する優れた耐性を備えています。パケットロス率が80%であっても安定してスムーズな会話が可能で、3~5秒間のネットワーク障害発生後でもスムーズな会話を継続できます。 Agoraの担当者によると、同社の会話型AIエンジンは開発と導入が非常に簡単とのことです。わずか2行のコードと15分でAIが会話を開始できるため、開発のハードルは大幅に下がります。導入は迅速で、LLMとTTSに関連するURLとキーを入力してコピーするだけです。詳細な手順については、Agoraの公式ウェブサイトのドキュメントセンターをご覧ください。 現在、この製品は、スマートアシスタント、バーチャルコンパニオン、口頭言語練習、スマートカスタマーサービス、スマートハードウェアなど、さまざまなシナリオで使用されています。 料金面では、AI音声対話は1分あたり0.098元で、1回の利用につき1000分が無料となります。自社開発の「インテリジェント割り込み」機能は、1分あたり0.042元の付加価値サービスです。 Agora AIのRTE製品ライン責任者である姚光華氏は、「顧客との改良と実際の使用シナリオの調査を経て、ユーザーとAIの間の会話は平均約3回の質疑応答で構成され、平均会話時間は約21.1秒であると計算しました。1会話あたりのコストはわずか3セントです。月に15回の会話があれば、月額コストは50セント未満、年間コストはわずか5元です。」と述べています。(周小白) |
Agora は、わずか 2 行のコードで AI が会話できるようにする会話型 AI エンジンをリリースしました。
関連するおすすめ記事
-
ByteDanceは中国のOpenAIを目指しているのだろうか? 2024年の研究開発費は、BAT(百度、アリババ、テンセント)の合計支出に近づくと予測されている。
-
Metaは「業績の低い従業員」を対象に従業員の5%を解雇する計画だ。
-
大手LIDARメーカーのHesaiは長安汽車から独占量産権を獲得し、受注は150万台を超えている。
-
スマートフォンの平均販売価格は上昇を続けており、すでに2,600元を超えており、来年はさらに大幅に上昇すると予想されています。
-
元Google CEOのエリック・シュミット氏は、AGIは自己改善していく中で開発を一時停止する必要があるかもしれないと警告し、イーロン・マスク氏もAIにはリスクが伴うと述べた。
-
Armのライセンス料の大幅値上げにより、SamsungはExynosチップ戦略の見直しを迫られている。