|
Sina Tech Newsは1月28日朝、DeepSeekの創設者であるLiang Wenfeng氏が深夜、DeepSeekが画像を生成できるJanus-Pro-7BというマルチモーダルAIモデルをリリースし、オープンソース化したと発表したと報じた。 Liang Wenfeng氏によると、GenEvalとDPG-Benchのベンチマークテストでは、Janus-Pro-7BがOpenAIのDALL-E3とStable Diffusionを上回ったという。 Sina Techは、DeepSeekのエンジニアが本日早朝、Janus Pro 7Bおよび1.5BモデルをHugging Faceプラットフォームにアップロードしたことを知りました。これら2つのモデルは、DeepSeekが昨年10月にリリースしたJanusモデルのアップグレード版です。 DeepSeekによると、Janus-Proは、マルチモーダル理解と生成を統合する革新的な自己回帰フレームワークです。Janus-Proは、DeepSeek-LLM-1.5bベース/DeepSeek-LLM-7bベースモデルを基盤としています。 マルチモーダル理解タスクでは、Janus-ProはSigLIP-Lを視覚エンコーダとして用い、384 x 384ピクセルの画像入力をサポートします。画像生成タスクでは、Janus-Proは特定のソースからダウンサンプリングレート16のトークナイザーを使用します。(Wen Meng) |
DeepSeekの創設者が今朝早くに発表しました!マルチモーダルJanus-Pro-7Bモデルがリリースされ、オープンソース化され、OpenAI DALL-E3を破りました。
関連するおすすめ記事
-
Appleが秘密裏に新プロジェクトを開始:Metaと競合するためスマートグラス市場に参入。
-
10月の新エネルギー車販売台数:BYDが初めて50万台を突破、XPeng、Leapmotorなども新記録を樹立。
-
ロボット犬が青島市消防救助隊に配備され、3.6時間連続して活動できる。
-
滴滴出行:春節期間中、配車サービスの需要は25%増加する見込みで、特にハルビンと三亜間の配車サービスの需要が高くなる見込みです。
-
ロビン・リー:百度の Wenxin ビッグデータ モデルは、1 日の呼び出し回数が 15 億回を超え、6 か月で 650% 増加しました。
-
春節の福祉詐欺アプリをCCTVが暴露:5つの要素(金、木、水、火、土)が入った赤い封筒を集めて巨額の現金を引き出すのは罠。