GoogleのWhiskが楽しい

4.0
AI
AI
この記事は約5分で読めます。

Googleが発表したWhiskが生成AIのことがよくわからない人も、プロンプトが書けちゃう人でも楽しいことに気づいて、一瞬でハマってしまいました。画像生成速度も速くて、サクサク作れちゃうので、ついついあれこれ作っちゃってます。

Whisk: 頭にあるアイデアをパッとかたちに
本日より、Google Labs で生成 AI を活用した画像生成の試験運用機能 Whisk を日本を含む 100 以上...
スポンサーリンク

Google Whiskとは

Geminiに聞いてみました。

Q. Google Whiskとはなんですか?
300文字以内で中学生でもわかるように教えて下さい。

Google Whiskは、Googleが開発した画像生成AIツールです。

普通、AIで絵を作る時は言葉で指示を出すけど、Whiskは複数の写真を選んで「混ぜて」と指示を出すだけで、AIが新しい絵を作ってくれます。

例えば、猫の写真と夕焼けの写真を選んで混ぜると、夕焼けを背景にした猫の絵ができます。まるで泡立て器(Whisk)で材料を混ぜるみたいだから、この名前がついたんだって。

Whiskは無料で使えるから、みんなも試してみてね!

‎Gemini - Google Whiskって何?
Created with Gemini

詳しい情報は以下のサイトあたりを見てもらうと良さそうです。

グーグル、画像を組み合わせて画像をつくる「Whisk」
Googleは12日、「Google Labs」で生成AIを活用した画像生成の試験運用機能「Whisk」を発表した。日本...
Google、画像プロンプトで画像をリミックス生成する「Whisk」
Googleは、新しい画像生成AIツール「Whisk」を発表した。被写体、シーン、スタイルの3つの画像をドラッグ&ドロッ...
Google発の新しい画像生成AI「Whisk」限界拡大で日本でも!【akutaji Vol.315】
Google は 2025 年 2 月 11 日(火)、昨年 2024 年 12 月中旬に実験的サービス提供プログラム「...

やってみたこと

お昼休みにスマホでポチポチ。

テンプレートがあってモデルの画像をスマホから選ぶだけでできちゃいます。

ほんと選ぶだけ。
雪山の写真はプロンプトで作りました。

そしてすごいのはプロンプトでの再現性があること。
例えば生成したこの画像。

雪原の中でこたつに入っている不思議な構図

なんと、下のプロンプトで再現できちゃいます。

A grainy, 1960s film aesthetic image depicting a person with light skin tone, wearing a black hoodie and blue jeans, sitting inside a kotatsu.  
The person is in the process of putting on a gold and red mask. 
The kotatsu is partially visible, suggesting a warm, cozy interior contrasting with the cold exterior. 
The background is a snow-covered landscape with rolling hills densely covered in coniferous and deciduous trees, rendered in muted whites, grays, and browns.  
The sky is a uniformly light gray.  
The image features high contrast, deep blacks, and bright whites, with a noticeable film grain and a warm, yellowish tint.  
A slight vignette darkens the edges, and the focus is sharper on the person in the kotatsu, softening towards the periphery.  
The lighting mimics a single, powerful flash, creating dramatic shadows. 
The overall impression is a nostalgic, slightly imperfect, and cool aesthetic, capturing a candid moment in a cold, quiet winter scene.  
The scene is asymmetrical, emphasizing a sense of captured spontaneity.
コピーボタンがあるから簡単です。コピーするだけ。

プロンプトをちょっといじってあげるとこの通り。2020年代風で金色のマスクにしてみました。

指定した2020年代のスタイルというのが、何なのかはよくわかってません。

いろいろ作ってみた

そんなわけで、いろいろ作ってみました。

自分が持っている写真をもとにいろいろ作れちゃいます。楽しい!

もちろん失敗も多数あります

特に2頭身キャラを車に乗せるのはまだまだ難しいようです。

プロンプトでえっちらおっちらやってました。

2頭身のキャラが運転してもらうのに苦労している様子

その他生成した画像ギャラリー

細かく見ると完璧じゃないけど、画像をかけあわせて生成してくれるのはとても良いです。

GoogleのWhiskは、これまでのGoogleの画像解析技術と固有名詞の紐づけが高レベルで活用されてると感じました。
興味がある方、お試しあれ!

Whisk: 頭にあるアイデアをパッとかたちに
本日より、Google Labs で生成 AI を活用した画像生成の試験運用機能 Whisk を日本を含む 100 以上...

コメント

タイトルとURLをコピーしました