|
Sina Tech Newsは1月28日朝、DeepSeekの創設者であるLiang Wenfeng氏が深夜、DeepSeekが画像を生成できるJanus-Pro-7BというマルチモーダルAIモデルをリリースし、オープンソース化したと発表したと報じた。 Liang Wenfeng氏によると、GenEvalとDPG-Benchのベンチマークテストでは、Janus-Pro-7BがOpenAIのDALL-E3とStable Diffusionを上回ったという。 Sina Techは、DeepSeekのエンジニアが本日早朝、Janus Pro 7Bおよび1.5BモデルをHugging Faceプラットフォームにアップロードしたことを知りました。これら2つのモデルは、DeepSeekが昨年10月にリリースしたJanusモデルのアップグレード版です。 DeepSeekによると、Janus-Proは、マルチモーダル理解と生成を統合する革新的な自己回帰フレームワークです。Janus-Proは、DeepSeek-LLM-1.5bベース/DeepSeek-LLM-7bベースモデルを基盤としています。 マルチモーダル理解タスクでは、Janus-ProはSigLIP-Lを視覚エンコーダとして用い、384 x 384ピクセルの画像入力をサポートします。画像生成タスクでは、Janus-Proは特定のソースからダウンサンプリングレート16のトークナイザーを使用します。(Wen Meng) |
DeepSeekの創設者が今朝早くに発表しました!マルチモーダルJanus-Pro-7Bモデルがリリースされ、オープンソース化され、OpenAI DALL-E3を破りました。
関連するおすすめ記事
-
OpenAI の「パーソナル アシスタント」Operator が ChatGPT アプリのコードに登場し、加入者は最初にそれを体験できる可能性があります。
-
Apple が「アメリカで最も経営が優れた企業」に選ばれ、Microsoft の 4 年間の支配に終止符が打たれた。
-
年次総会で、馬化騰(ポニー・マー)氏はWeChatで電子商取引を行う方法に焦点を当て、外部の世界がWeChatのギフト機能について過度に宣伝しないように期待した。
-
Xiaomiの第3四半期財務報告が発表され、収益は過去最高の925.1億元を記録。
-
イーロン・マスクの200万ドルの空飛ぶ車がテスト飛行を実施:垂直離着陸。
-
報道によれば、快手は商業化体制を調整中だという。