【Stable Diffusion】アニメイラスト系画像生成モデルを比較する

当ページのリンクには広告が含まれています。
  • この記事は2023年1月時点の情報です

Stable Diffusionに慣れてくると、次に試したくなるのが自分にあったモデル探し。より作りたい画像に合ったモデルを使うことで、同じプロンプトでも段違いにクオリティの高い絵を生成させることができます。

アニメ・イラスト系だけでもかなりの種類がありますが、今回、比較的新しめのイラスト向けモデル5種類を比較してみました。

目次

比較した方法とモデル一覧

イラスト系で人気の高いもの、比較的新しいモデルを5つを比較してみることにします。

スケジューラは「EulerDiscreteScheduler」に統一し、細かいパラメータはいじらず使用しました。

  • waifu-diffusion v1.4
  • BPModel
  • anything-v3.0 
  • ACertainThing
  • Counterfeit-V2.0

それぞれのモデルで、以下のプロンプトで3枚の画像を生成させてみます。特にアニメ絵の指示や絵柄の指定は加えていません。

prompt = "Various flowers with one girl, full body illustration of girl, Shoulder-length hair, hair color is dark brown, emotional soft lighting, beautiful face with pink cheeks, Nostragic background"
negative_prompt= "lowres, bad anatomy,text, error"
image = pipe(prompt, height=512, width=512).images[0]

ベーシックなモデルの「stable-diffusion-2-1」ではこのような結果になりました。

Masterpieceなどクオリティアップ系呪文や、アニメ絵の指定を入れていないのでこんなものでしょう。かなり残念な生成結果ですが、ここからどう変わっていくか楽しみです。

waifu-diffusion v1.4

最も有名といっても過言ではないアニメ・イラスト系モデルです。比較的初期から登場しており、v1.4は「Stable Diffusion v2-1-base」がベースにされています。

倫理的問題は比較的クリアされており、ライセンス上は商用利用も可能とのこと。

3枚生成した結果はこの通り。

イラスト生成 waifu-diffusion v1.4

そこそこいい感じの画像が安定して生成されていました。

”emotional soft lighting”をかなり多様な解釈で出力している印象です。

Crosstyan/BPModel

高解像度のデータを学習させたアニメ調の安定拡散モデル。

倫理的な配慮から、AI生成した画像は学習に用いていないとのこと。

生成結果はこちら。

今回のプロンプトでは人体が破綻しやすく、まともに生成させるのに苦労しました。

綺麗に生成できる時とそうでない時の差が大きいので、プロンプトをもっと細かく指定するか、生成ガチャをぶん回す必要がありそうです。

あと、学習元がSankaku Complex (nsfwイラストサイト) なだけあって、体感として明らかにNSFWフィルターにひっかりやすかったです。

Linaqruf/anything-v3.0

イラスト描画で人気の高いモデル。

後継のanything-4.0や5.0などのバージョンも公開されていますが、こちらは製作者が違うようです。

イラスト生成 anything-v3.0

人気が高いだけあって、かなり安定して画像が生成できました。

手先足先の細かい破綻はあるけれど、全体のバランスはかなりいいと思います。有望なモデルのひとつ。

JosephusCheung/ACertainThing

前身となる「ACertainModel」をベースに、anything-v3.0の絵柄に近づけたモデルとのこと。

イラスト生成 ACertainThing

寄りの絵のクオリティの高さに驚きます。

一発出し×3枚でこれなので、複数回生成させれば十分な絵が作れそう。

ただ、今回使ったモデルの中では「”Various flowers 」「full body illustration」の指示が無視されがちなのが気になりました。説明欄で”雑なプロンプト”への苦言を呈しているだけあって、プロンプトをしっかり練る必要がありそうです。

gsdf/Counterfeit-V2.0

「DreamBooth」に階層マージ、LoRAによるファインチューニングを加えたモデル。

イラスト生成 Counterfeit-v2.0

グラデーションが効いたライティングが綺麗ですが、人体がかなり溶けています。

サンプルは綺麗なのでこちらもプロンプト、パラメータ側で工夫が必要かも。

特に良かったモデルは「ACertainThing」

今回試したモデルの結果を主観でまとめてみました。

モデル身体構図・
雰囲気
プロンプト
再現度
waifu-diffusion v1.4
BPModel
anything-v3.0 
ACertainThing○ ?
Counterfeit-V2.0×

綺麗なイラストを安定して出力できていたのは「ACertainThing」。

今回は全身を描いた絵が少ないので、末端の崩れについては要検証ですが、加筆修正前提なら十分すぎるクオリティです。

Anything3.0」も全身絵が安定していました。

あまりパッとしなかったモデルも、プロンプトやスケジューラを変更することで大きく変わると思います。生成した画像を完成稿とする場合は、あとは生成ガチャの試行回数でしょうね。 

今回検討した中で気になったモデルがあれば、ぜひ試してみてください!

最後に、「ACertainThing」にアオミのイラストを描いてもらいました。

かっわいい!!

よかったらシェアしてね!
  • URLをコピーしました!

コメント

コメントする

目次