SHOUJIKE

NVIDIA は、新しい音声を変更および生成できる AI モデル Fugatto を紹介します。

11月26日、Nvidiaが、サウンドを変更したり新しいサウンドを生成したりできる、音楽とオーディオを生成するための新しい人工知能モデルであるFugattoを披露したと報じられました。

Fugatto のユニークな魅力は、人工知能の従来の境界を超え、既存のオーディオ素材を受け取って分析するだけでなく、柔軟に修正できる点にあります。

たとえば、ピアノ伴奏のメロディーを感動的なボーカル演奏にシームレスに変換したり、話し言葉の録音におけるアクセントの特徴や感情のニュアンスを調整したりすることができ、これまでにないオーディオ変換能力を発揮します。

Nvidia はこの技術を一般公開する予定はないが、Fugatto の合成オーディオへの応用の可能性とそれがもたらす変化は、業界で幅広い注目を集め、白熱した議論を巻き起こしている。

しかし、生成型人工知能モデルの急速な発展に伴い、その開発者は技術の悪用を効果的に防止するという課題にも直面しています。特に、ユーザーがこの技術を利用して誤解を招く情報を作成したり、著作権のあるキャラクターやコンテンツを生成して他人の権利を侵害したりするのをどのように防ぐかは、喫緊の課題となっています。

さらに、OpenAIやMetaといった業界の大手企業も、音声や動画を生成できる高度なモデルをいつリリースするかについては口を閉ざしており、具体的な時期はまだ明らかにしていない。(Deer Antler)