Stable Diffusionメモ

(wide shot, 1girl ,teen,mountain, travel)

Stable Diffusion（SD)というか、画像生成系AIはしばらく追いかけていきたい。
今のところ、SDが例えばMidjarneyとかと比べて好きなのは、世界中のユーザーが好き勝手に弄り回しているところ。

Civitaiを見ればわかるように、ほとんどカオスで、こういう雑多な欲望にまみれている状態はとても楽しい。どうも最近は（特に日本は）自分がやらないこと（実は出来ないこと）を正当化するために、何かをやってる人を叩く風潮があって、そういう空気感が本当に嫌い。まあ昔もあったんだろうけど、それがSNSで可視化されて、さらに最近の取材力が低下したマスコミが炎上の種発見装置として使いはじめて、さらにひどいことになった。もうそういった雑音は一切無視するくらいしか方法はない。幸い、もう余生もそんなに長くないし、失うべき社会的地位もないから、あまり気にしても仕方ない。

愚痴はともかく。

日進月歩のSDだから、新しい機能とかチェックポイント、LoRAを追いかけているだけでしばらくは楽しめそうだけど、せっかくなので軽く目標を決めておくことにした。昨日書いた「旅画像」の生成だ。

最終的な目標として

実在の風景
統一された主人公（女の子）
ある程度統一感のある画風、質感

を実現したい。

が、ちょっと試した感じでも、これがけっこう今のSDとは相性が悪い。実在の風景のイラスト化は画像加工ツールだとある程度のレベルなら簡単にできるけど、SDだとImage to Image(I2I)を使ってもいい感じにはならない。元写真の際限度を変化させてみても、単なる劣化版になるか、ぜんぜん別の風景になってしまう。統一した主人公も難しい。LoRAで人物学習させると背景がそれに引っ張られてしまうし、人物のアップ的なレイアウト以外はなかなかうまくいかない。

結局、今のSDはいろいろと情報とか制限事項を与えたのちに「じゃ、描いて」と一任する手法で、ダメな場合は「もう一度描き直して」と、丸ごとダメ出しする感じ。「ここ直して」がなかなかうまくいかない。

でも、こういう問題はみんな思っていることなので、世界中のオタクが様々な手法を試し、プラグインを作ったりLoRAを作ったりしてる。半年後にはだいぶ解決しているんじゃないかとも思う。

まずは、ダメな生成画像のダメ出しフィルタあたりが実装されるんじゃないかと想像（というか期待）してる。生成された画像を採点して、一定水準以下をゴミ箱に放り込む機能。