SHOUJIKE

DeepSeekの創設者が今朝早くに発表しました!マルチモーダルJanus-Pro-7Bモデルがリリースされ、オープンソース化され、OpenAI DALL-E3を破りました。

Sina Tech Newsは1月28日朝、DeepSeekの創設者であるLiang Wenfeng氏が深夜、DeepSeekが画像を生成できるJanus-Pro-7BというマルチモーダルAIモデルをリリースし、オープンソース化したと発表したと報じた。

Liang Wenfeng氏によると、GenEvalとDPG-Benchのベンチマークテストでは、Janus-Pro-7BがOpenAIのDALL-E3とStable Diffusionを上回ったという。

Sina Techは、DeepSeekのエンジニアが本日早朝、Janus Pro 7Bおよび1.5BモデルをHugging Faceプラットフォームにアップロードしたことを知りました。これら2つのモデルは、DeepSeekが昨年10月にリリースしたJanusモデルのアップグレード版です。

DeepSeekによると、Janus-Proは、マルチモーダル理解と生成を統合する革新的な自己回帰フレームワークです。Janus-Proは、DeepSeek-LLM-1.5bベース/DeepSeek-LLM-7bベースモデルを基盤としています。

マルチモーダル理解タスクでは、Janus-ProはSigLIP-Lを視覚エンコーダとして用い、384 x 384ピクセルの画像入力をサポートします。画像生成タスクでは、Janus-Proは特定のソースからダウンサンプリングレート16のトークナイザーを使用します。(Wen Meng)