SHOUJIKE

Google は、複数の画像をアップロードして新しい画像を生成できる新しい AI 画像生成ツール Whisk をリリースしました。

ITホームニュース、12月17日 – Googleは本日、AI画像生成ツール「Whisk」をリリースしました。このツールを使うと、他の画像をヒントとして画像を生成することができ、長々としたテキストヒントを入力する必要がなくなります。ユーザーは画像を用意するだけで、AIが生成する画像の主題、シーン、スタイルを指定できます。

Whiskを使用すると、テーマ、シーン、スタイルのヒントとして複数の画像を提供できます(もちろん、テキストヒントを使用することもできます)。適切な画像がない場合は、サイコロアイコンをクリックすると、Googleが自動的にヒントとして画像を入力します(これらの画像もAIによって生成されるようです)。さらに、ユーザーはプロセスの最後にテキストボックスにテキストを入力して、対象画像に関する詳細情報を追加できますが、これは必須ではありません。

Whiskは画像と、それぞれの画像に対応するテキストプロンプトを生成します。ユーザーが結果に満足したら、画像を保存またはダウンロードできます。さらに調整が必要な場合は、テキストボックスにテキストを入力するか、画像をクリックしてテキストプロンプトを編集することで、画像を最適化できます。

IT Homeは、Googleがブログ記事で、Whiskは「ピクセルレベルの微調整ではなく、迅速な視覚的探索」を目的として設計されていると強調したと報じた。また、同社はWhiskには「バイアス」が見られる可能性があり、ユーザーが潜在的なヒントを編集できる可能性があると述べている。

ユーザーによると、Whisk は短時間の使用で興味深い体験を提供したとのことです。画像生成には数秒かかり、生成された画像は時々奇妙に見えることもありますが、生成されたコンテンツはすべて簡単に繰り返し使用したり修正したりできます。

Google によれば、Whisk は最新世代の Imagen 3 画像生成モデルを使用しており、これも本日リリースされたとのことです。