ICBNPモデルは、「写真じゃないなんて信じられない」リアル画像が生成できる

Stable Diffusion


これまで、Stable Diffsion web UIを使い、リアル系のAI画像生成を中心に行ってきました。
使用したモデルは、AI美女生成に定評のある、Beautiful Realistic Asiansや、KisaragiMixyayoi_mixBracingEvoMixなどです。

今回、使うモデルもリアル系のモデルになります。

CBINP – “I Can’t Believe It’s Not Photography”

「写真じゃないなんて信じられない」

なかなか挑戦的なモデル名ですね。これは使ってみる価値ありそうだと思いました。

過去に使ったモデル(ご参考)

Beautiful Realistic Asians Ver7(BRA7)

KisaragiMix

yayoi_mix

ICBNPモデルの利用準備

モデルはこちらのサイトからダウンロードして、Stable Diffusion web UIの所定のフォルダにコピーしてください。所定のフォルダは以下になります。

(インストールフォルダ)/stable-diffusion-webui/models/Stable-diffusion

GoogleやAmazonのクラウドでStable Diffusionを利用されている方の悩みとしてアップロードに時間が掛かるというのがあります。時間制限があるのに、アップロード時間が勿体なく、私も随分悩まされました。

Amazon SageMaker Studio Labの方は、以下の方法で高速にアップロードできます。その方法を掲載しています。Google Coraboratoryの方も参考になるかもしれません。

ICBNPを利用した画像生成

これまで、人物中心に画像生成を行ってきましたが、人物以外も今回は挑戦してみようと思います。
CIVITAIのサイトで公開されている画像で、できるだけLoRAなどを使用していないプロンプトを拝借しましてAI画像生成してみました。

ICBNPで人物以外の画像生成

プロンプトは、CIVITAIのサイトで確認いただくか、画像をダウンロード頂いてStable Diffusion web UIのPNG Infoで確認頂きたいと思います。

風景

ビール

絵画

部屋

同じプロンプトでClip Skipを1~3で生成してみました。

Clip Skip=1 CIVITAIで公開されているのは、こちらの設定です。

Clip Skip=2

Clip Skip=3

フェレット

我が家のペットにフェレットがいますので、思わず生成してみました。

フェレットは断然、実物の方が可愛いです。下の写真はAI画像ではなく本物のフェレット(我が家のペットちゃん)です。

ICBNPで人物の画像生成

女性

アジア系ではない女性を生成したのは、はじめてかもしれません。

男性

バイクのディテールも素晴らしいですね。

Beautiful Realistic Asians Ver7(BRA7)と比較①

過去に生成した、OLさんの画像と同じプロンプトを使って、比較してみたいと思います。

こちらのプロンプト(prompt, 呪文)は、以下の記事で記載していますので参考にしてください。

プロンプトとパラメータの設定は同じにして、シード(Seed)値をランダム(Seed=-1)にして画像生成しました。

Beautiful Realistic Asians Ver7(BRA7)と比較②

同じような画像ですが、こちらの画像と比較してみましょう。

設定の違いはサンプラー「Eura a」→「DDIM」、CFG scale: 8→6 くらいですが露出多めの画像が生成されました。

プロンプトは以下になります。「COWBOY SHOT」も消しているのも影響しているかもしれません。

(Masterpiece, BestQuality:1.3), (ultra detailed 8k:1.2), (hyperrealistic:1.35),(RAW photo:1.2),High detail RAW color photo, professional photograph, (Photorealistic:1.45), (realistic:1.4), ,professional lighting,
1 beautiful girl, light smile, shirt with collars, waist up, dramatic lighting, from below,18yo,office lady, learge breasts
Negative prompt: EasyNegative, badhandv4, ng_deepnegative_v1_75t, (mole:1.5), (worst quality:2), (low quality:2), (normal quality:1.5), monochrome, grayscale, (bad_prompt_version2), glans, skin spots, acnes, skin blemishes, age spot, bad anatomy, bad feet, bad hands, bad quality,(cloudy:1.5),(logo:2.0),(mark:2.0),(pussy:2.0),loli, child, petite, lolita,bad-image-v2-39000, (bad-hands-5, negative_hand-neg:1.1), bad_prompt_version2, verybadimagenegative_v1.3,
bad anatomy, blurry, missing finger, missing hand, missing arm, two girls,(low quality:2), (normal quality:2),(navel:1.3)
Steps: 88, Sampler: DDIM, CFG scale: 6, Seed: 3837240163, Size: 512x768, Model hash: 1a17bcd93d, Model: beautifulRealistic_v7, VAE hash: 735e4c3a44, VAE: vae-ft-mse-840000-ema-pruned.safetensors, Version: v1.6.0

VAEについて

VAEは「vae-ft-mse-840000-ema-pruned.ckpt」を、いつも使用していましたが、ICBNPのモデル自体に「vae-ft-mse-840000-ema-pruned.ckpt」がマージされているということで、結果に多少影響があったかもしれません。

以下に、VEAを入れたもの(重複)、とVAEなしで画像生成した結果を掲載しました。品質は細かい検証をしたわけではないのですが、有り無しで影響は出ています。

VAEあり

VAEなし

まとめ

CBINP – “I Can’t Believe It’s Not Photography”「写真じゃないなんて信じられない」という、リアル系モデルを使用しました。

人物以外は非常に幅広い用途に対し、品質の良い画像が出力されました。人物はチューニングしていないのもありますが、やはり美女系モデルの方が品質は高いように感じました。好みの問題ですし、あくまで美女かどうかではなく、リアルさで勝負ですので美人すぎてAIっぽくないリアルな人物という点であればCBINPなのかもしれません。

人物以外を出力することは、今までなかったですしデザインがのようなものも出力するのは楽しそうだと思いました。

コメント

タイトルとURLをコピーしました