|
3月7日、テンセント・フンユアンの公式WeChatアカウントによると、テンセント・フンユアンは生の動画モデルを公開し、オープンソース化した。同時に、リップシンクやモーションドリブンゲームプレイなどの機能を導入し、背景効果音や2K高画質動画の生成もサポートした。 公式紹介によると、画像から動画を作成する機能により、ユーザーは画像をアップロードし、画像をどのように動かしたいか、カメラをどのように配置したいかを簡単に説明するだけで、Hunyuan が必要に応じて画像を動かし、5 秒間の短い動画に変換し、背景のサウンド効果を自動的に追加することもできるという。 さらに、人物の写真をアップロードし、「リップシンク」したいテキストや音声を入力すると、写真の人物が「話したり」「歌ったり」することができます。また、「モーションドリブン」機能を使用すると、ワンクリックで同様のダンスビデオを生成することもできます。 現在、ユーザーは公式サイトを通じてHunyuan AI Videoを体験することができ、企業や開発者はTencent Cloudを通じてAPIインターフェースの使用を申請することができる。 このオープンソースの画像ベース動画モデルは、Hunyuan画像ベース動画モデルのオープンソース化の継続です。モデルのパラメータ総数は130億のままです。このモデルは、リアルな動画制作、アニメキャラクター、さらにはCGIキャラクターの生成など、様々な種類のキャラクターやシーンに適用できます。 オープンソースコンテンツには、重み、推論コード、LoRAトレーニングコードが含まれており、開発者が混合ソースモデルに基づいて独自のLoRAモデルやその他の派生モデルをトレーニングするのに役立ちます。現在、GitHubやHuggingFaceなどの主要な開発者コミュニティでダウンロードとテストが可能です。(周小白) |
テンセントのHunyuanプラットフォームは、画像生成ビデオモデルをリリースしてオープンソース化し、リップシンクやモーション駆動型ゲームプレイなどの機能を実現しました。
関連するおすすめ記事
-
フォードのCEOジム・ファーリー氏は「大型電気自動車」はかさばり高価だと批判した。
-
マイクロソフトCEOサティア・ナデラ氏は、AIモデル「Muse」をベースにしたビデオゲームを発売する計画を明らかにした。
-
一大計画発表!次世代北斗システムの構築、2035年までに完了予定。
-
デラウェア州の判事がマスク氏の控訴を認める:560億ドルの給与訴訟は新たな展開へ。
-
XPeng Motors: 来年末までに損益が均衡すると予想しており、第4四半期の出荷台数は過去最高に達すると予想されています。
-
長城汽車は、新たな超高級車ブランドとなる可能性のある「Confident Cars」を立ち上げる予定であると報じられている。