前回は、Stable Diffusion web ui の「CFGスケール」というパラメータが、生成される画像の描写にどのような影響がでるのか、体感しました。
Stable Diffusion web ui は、プロンプトを作成して、あとはGUI操作で設定を変えていくだけで簡単に画像が生成できます。なんて聞いたけど、モデル(check point)、VAE、サンプラーなど選ぶものが多かったり、パラメータが多すぎてどうすれば良いか分からないですね。操作は分かってきましたが、どこを変えれば思い通りの画像が得られるのか、全く想像がつきませんよね。今回も、焦らずに少しずつ試しながら、意味を理解していきたいと思います。
今回は、まだ使った事のないモデル(check point)を使ってみたいと思います。
モデル(check point)とは
過去の記事でモデル(check point)とは何か、超初心者の私が理解した、ざっくりしたイメージを描きました。
モデル(check point)は、生成される画像の画風のようなもので、「2Dアニメっぽい」もの、「リアルな写真風のもの」など、を選択して好みの画風に合わせたモデル(check point)を選択します。
AIが学習するときにどのような画風の画像を使って学習したのかが決まるので、AIモデルの性格のようなイメージで捉えると何となく分かるかと思います。
今回は、アジア系リアルモデルでは有名で、よく耳にする「Beautiful Realistic Asians(BRA)」を新たに試してみたいと思います。
これまで、利用したモデル(check point)は2つです。どちらもリアル系に強いモデルと言われています。
- DreamShaper 8
- chilled_remix_v2
Beautiful Realistic Asians(BRA)の特徴
Beautiful Realistic Asians(BRA)とは、アジア人の顔をリアルに生成するモデルです。このモデルは、大量のアジア人の6,000枚以上の画像を使って学習がされています。最近リリースされたBRAV6(BRAバージョン6)は、細かい描写能力が高まり品質が向上したようです。女性に関しては、自然で美しい日本人に近い画像が出力される確率が高まったようです。
BRAV6で画像生成
それでは、実行してみます。
ランダムに実行

さすが、リアル系のアジア美女に定評のある、BRAV6だけあって、初回からかわいい女性を出力してくれました。

X/Y/Z plotでパラメータ調整の結果を確認
最近、習得した技をご紹介します。

1つずつランダムに生成(ガチャを引く)するのも大変なのでパラメータを変更した際に、結果がどのように変化するかを表形式で出力できる「X/Y/Z plot」という機能を使用します。Script(スクリプト)を「X/Y/Z plot」と選択して、結果のx軸(横方向)、Z軸(縦方向)に出力したいパラメータを選択します。Zは更にこの組み合わせを、もう一つの違った軸で出力できます。

今回はtype(左)を、以下の二つのパラメータを変えて出力しています。value(右)は、変更する数値をカンマ区切りで指定したり、10-100のようにレンジで指定できます。(+20)とすると20ずつ数値を増やすという設定になります。
- X軸: Steps
- Y軸: Clip skip(4以上は良い画像が得られない為1~3)
CFGスケールを調整
私の好みになりますが、今回出力された画像ではClip Skip=2の真ん中の行の女性を採用したいと思います。Clip Skip=2の設定でCFGスケールを変更します。

CFGスケール=7.0を採用することにしました(あくまで個人的主観です)。
先ほど、Stepsは20刻みでしたので、もう少し細かく確認してみます。

最終的にSpteps=7.0を選択し、アップスケールしました(アップスケールはまたの機会に説明します)。微妙に画像が変化して胸元が少し開いた感じの画像になりました。
前回まではAI画像っぽい感じでしたが、今回はナチュラルな質感になったように感じます。

今回使用したプロンプト(呪文)
前回と同じだと思いますが、一応掲載しておきます。未だに全身が写った画像を出したいのですが、胸より上部の画像しか出力できない悩みは解消しておりません。
Prompt:
1 beautiful young girl,18yo,very cute, detailed face,extremely detailed eyes and face, eyes with beautiful details,smiling, cinematic lighting, action,(shiny skin),detailed skin,extremely detailed face,extremely detailed eyes,eyes with beautiful details,extremely beautiful face,
(soft saturation:1.3), (fair skin:1.2),wearing a white clothes,85mm lens,f/8.0,upper_body,large breasts, cleavage, knee,looking at viewer, beautiful eyes,(nsfw:1.2),
(8k, RAW photo, best quality, masterpiece:1.2), ((masterpiece:1.4, best quality)), ((masterpiece, best quality)),High detail RAW color photo, professional photograph, (realistic, photo realistic:1.37),professional lighting, physically-based rendering,school girl,(black hair, lower side-tail hair style), (sailor uniform, pleated skirt:1.2)
Negative Prompt:
(bad-hands-5:0.9),(nipple:1.2),
painting, sketches, (low quality, worst quality:1.5), deformed, bad anatomy, lowres, monochrome, grayscale, ugly face, half-open eyes, deformed eyes, long body, inaccurate limb, bad hands, mutated hands, mutated legs, missing fingers, extra fingers, extra arms, text, error, cropped, jpeg ,CG,2D,artifacts, signature, watermark, username, artist name, out of focus, make-up, (mascara), rouge, face paint, infant, toddler, (multiple angles:1.5)
まとめ
BRAV6は有名なリアル系モデルとあって、期待通りの画像を生成してくれました。画像生成を初めて1週間程度の私のレベルで、これだけの質感の画像を生成できるということですから、凄い時代になりましたよね。
これで満足してしまっていますが、上級の方から見ると指摘ポイント満載なのではないでしょうか?しかし私のレベルでは何が悪いのか想像がつきません。ダメ出しを頂けると嬉しいです。