コンテンツへスキップ

複雑なプロンプトでもSDXL TURBOは品質良く画像生成できる!?

前回は、2023.11.29にStability AIから、「SDXL TURBO」がリリースされ、早速試してみました。本当にリアルタイムでAI画像が生成されていくことに驚かされました。

通常Stable Diffusion web UIでは、最低でも20ステップくらいの設定で画像生成を行っていましたが、SDXL TURBOではステップがなんと「1」なのです。早い理由は、ステップが1回で画像が生成できる点にあります。

SDXL TURBOでリアルタイム生成した画像

前回、初めてSDXL TURBOでAI画像生成を行いまいたが、使い勝手も慣れていなかったので、プロンプトを弄っているうちに、利用制限で使えなくなってしまいました。前回生成した画像がこちらです。

プロンプト:dog walking on the beach

このようにプロンプトは非常に簡易なものでありました。では、複雑なプロンプトでもリアルタイムに画像が生成できるのでしょうか?今回は、それを検証してみたいと思います。

SDXL TURBOで「森の植物を描く風景画(油絵)」を生成

ちなみに、前回は利用制限になりましたが、翌日にはまた利用できるようになっていました。クレジット回数などの表記が無いために、何回画像生成ができるのか不明です。また、プロンプトを追記している最中に画像が切り替わるので、その書き換えが何回とカウントされるのか分かりません

oil painting,concept art,no creatures,scence,tree,plant,water,forest

これが1秒ほどで生成されるので驚きです。

品質系のプロンプト(masterpiecebest qualityなど)は記述が必要なのかも試したかったので、以下のプロンプトで試してみます。

(masterpiece:1.2), best quality, highres, original, extremely detailed wallpaper, perfect lighting, CG,realism,oil painting,unreal engine,concept art,no creatures,scence,tree,plant,water,forest,

品質の違いを見たかったのですが、画調が若干変わってしまいました。「CG」というキーワードが余分かもしれません。「CG」を削除して試してみます。

(masterpiece:1.2), best quality, highres, original, extremely detailed wallpaper, perfect lighting,  realism,oil painting,unreal engine,concept art,no creatures,scence,tree,plant,water,forest,

今度は、光源設定:perfect lighting、品質と関係ないもの:originalとwallpaper を消しました(下図)。

(masterpiece:1.2), best quality, highres, extremely detailed, realism,oil painting,unreal engine,concept art,no creatures,scence,tree,plant,water,forest

こうみると、品質系プロンプトは必要だと分かります。

同じプロンプトでSeaArt.AIでも出力してみました。

oil painting,concept art,no creatures,scence,tree,plant,water,forest

SDXL TURBOで「幻想的な海の中」を生成

日本語でSDXL TURBOのリアルタイム画像生成にトライしてみます。

リアルな写真、幻想的、海の中、クジラ、ウミガメ、魚の群れ、海賊船

海賊船が小さいですね。

リアルな写真、幻想的、海の中、サメ、海賊船

リアルな写真、幻想的、海の中、魚の群れ、沈没した海賊船

沈没したという表現が、うまく認識されたようです。魚が金魚みたいでチープですね。

絵画、幻想的、海の中、魚の群れ、沈没した海賊船、薄暗い

絵画」で、雰囲気を出すために「薄暗い」というプロンプトを追加すると、沈没船はリアル感が増しました。

品質系のプロンプトを追加します。

(masterpiece:1.2), best quality, highres, original, extremely detailed wallpaper, perfect lighting, CG,realism,幻想的、海の中、魚の群れ、沈没した海賊船

絵画を消したところ、海上に浮上してしまいました。

(masterpiece:1.2), best quality, highres, original, extremely detailed, realism, Fantastic, underwater, schools of fish, sunken pirate ship

日本語を英語に置き換えると、海の中に戻ってきました。プロンプトを次から次へと変えて試してもストレスが溜まりません。プロンプトを考える時間より、画像生成の時間の方が短いです。

SDXL TURBOで「トランスフォームするメカ・ロボット」を生成

メカをSDXL TURBOで生成してみます。

digital art of a highly detailed mech, dramatic lighting
digital art of a highly detailed (spherical:1.5) mech, dramatic lighting,blue

少しイメージと違いました。球の形をしたメカを出力させたかったので「Shaped like a ball」(球のような形)を追加しました。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,blue,futuristic,Shaped like a ball

ロボットではなくなりましたが品質がかなりアップしたように思えます。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,blue,futuristic,SMecha-robot that transforms into a ball-like shape

しっかりプロンプトの変更が反映されました。「Mecha-robot that transforms into a ball-like shape」(ボール状に変形するメカロボット)を追加したと思ったら「SMecha-robot」になってしまいましたが、結果オーライです。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,blue,futuristic,Mecha-robot that transforms into the shape of a sports car

スポーツカーにトランスフォームするロボットをイメージしましたが、足にタイヤのような描画がある程度で少しイメージと異なりました。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,blue,futuristic,SMecha-robot that transforms into the shape of a sports car

先ほど「SMecha-robot」というの誤字でうまくいったので、Sを追加してみました。
こちらの方がイメージに合いますね。トランスフォーム前のスポーツカーの状態ですね。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,red,futuristic,SMecha-robot that transforms into the shape of an orca
digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,red,futuristic,Mecha-robot that transforms into the shape of an eagle

シャチからの鷲(イーグル)です。そしてドラゴンを生成します。

digital art,(highly detailed:2), (spherical mech:2), dramatic lighting,green,futuristic,Mecha-robot that transforms into the shape of an dragon

SDXL TURBOで「OLのAI美女」を生成

以前、OLのAI美女を生成したプロンプトを公開しましたが、そちらのプロンプトを使ってSDXL TURBOに入力してみます。

(Masterpiece, BestQuality:1.3), (ultra detailed 8k:1.2), (hyperrealistic:1.35),(RAW photo:1.2),High detail RAW color photo, professional photograph, (Photorealistic:1.45), (realistic:1.4), ,professional lighting, 1 beautiful girl, japanese Businesswoman,light smile, shirt with collars, waist up, dramatic lighting, from below,18yo,office lady, learge breasts,COWBOY SHOT

SDXL TURBOでは、残念な結果です。日本人の美女は、やはりBRA7などの特化したモデルを使った方が品質は良いという事でしょうか。手も描画も苦手なようです。

SDXL TURBOの疑問として、ネガティブプロンプトは指定できないのか?指定可能ならどのようにk時術するのか?があります。現状、分かっておりませんので、分かり次第記事にしたいと思います。

1点補足するとSDXL TURBOで上記のプロンプトで画像生成したところ「learge breast」がNGワードのようで、生成が拒否されましたので、削除して生成しております。

ただ、今更ながら気づいたのですが、「large」のつもりが「learge」と間違っていましたね。それでもNGとなってしまうところがAIですね。

まとめ

前回に引き続き、SDXL TURBOリアルタイム画像生成を試してみました。今回は複雑な画像の作りこみができるかということを見てみましたが、結論として詳細の作りこみまで可能だと思いました。しかもリアルタイムで生成できます。

ただ、女性の出力はうまくいきませんでした。何度も試したわけではないですし、プロンプトの書き方が悪い可能性もあります。ネガティブプロンプトの記載が可能であれば、状況も変わりそうです。

リアルタイムに、これだけのクオリティの画像が生成できるようになると、次はリアルタイムに動画生成が可能な時代も、すぐそこまで来てそうですね。