SHOUJIKE

Doubao Large Model 1.5 Pro がグレースケール テストで利用できるようになりました。開発者は API を直接呼び出すことができます。

1月23日、Doubao公式WeChatアカウントによると、Doubaoの大型モデル1.5 Proバージョンが正式にリリースされ、現在Doubaoアプリでグレースケールで公開されており、多くのリクエストをいただいています。開発者はVolcano EngineのAPI(アプリケーションプログラミングインターフェース)を直接呼び出すこともできます。

Doubaoの公式紹介によると、Doubaoの大型モデル1.5Proは、知識(MMLU_PRO、GPQA)、コード(McEval、FullStackBench)、推論(DROP)、中国語(CMMLU、C-Eval)など、公開されている複数のベンチマークで世界をリードする結果を達成したという。

Doubaoによると、Doubao Large Model 1.5Proは事前学習に用いる活性化パラメータを小さくすることで、性能を損なうことなく学習コストを極めて低く抑えているという。大規模スパースMoEアーキテクチャを採用しており、これは活性化パラメータが7倍のDenseモデルの性能に相当し、業界標準のMoEアーキテクチャの約3倍のレバレッジをはるかに上回る。

さらに、Doubaoの大型モデル1.5Proのマルチモーダル機能が全面的に向上し、Doubaoの視覚理解モデルの新バージョンであるDoubao-1.5-vision-proは、最先端の視覚理解機能を備えています。

Doubaoの最新リアルタイム音声モデル「Doubao-1.5-realtime-voice-pro」は、Speech2Speechエンドツーエンドフレームワークを採用し、表現力の飛躍的な向上を実現。泣いたり、笑ったり、方言を話したり、歌ったりといった、リアルな音声表現を実現します。このモデルは現在、Doubaoアプリで完全に利用可能です。

DoubaoのWeChat公式アカウントからの画像