超お手軽にStableDiffusionをWEB UIで利用できるFooocusというものを使ってみました。
Fooocusとは何か?
細かいプロンプトや設定をしなくてもある程度ちゃんとした画像を生成してくれるシンプルな画像生成AIのフロントエンドのツール。下記のブログで丁寧に解説してくれています。VRAMも最低動作は4GB程度でいけるとのこと。
Pythonのインストールが必要ですが、それ以外はダウンロードして展開してファイルをクリックするだけで生成AIが利用できるようになります。
Stable diffusionが発表されたときGoogle Colabで構築してちまちまやっていた時に比べるとサクサクとリソースを意識しないで利用できるのは良いですね。
実際にFooocusを使ってみた
実際にいくつか画像生成を試してみた。GeForce RTX4070ti 12GBのグラフィックボードを利用して初期設定だと大体1枚10秒弱で生成されるみたいでした。指標の解釈がわかりませんが3.5it/sという速度だそうで。メモリは6.3GB程度を消費していました。
UIはシンプル。プロンプトを入れてGenerateを押すだけで初期設定だと2枚のデフォルト画像設定で生成された画像が生成されます。あまりAI画像生成は利用していませんが1年前の標準のStable diffusionに比べると(裏側でプロンプトがセットされていると思いますが)品質が良くなったと思います。
調べた感じだと、標準は下記のような設定だそうです。
Prompt
cinematic still {prompt} . emotional, harmonious, vignette, highly detailed, high budget, bokeh, cinemascope, moody, epic, gorgeous, film grain, grainy
Negative Prompt
anime, cartoon, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, disfigured
Advancedでstyleを切る(裏側のprompt設定が切られているとおもう)とこんな感じの画像に。
sai-digital art
sai-anime
植物は?
1年前より圧倒的に画質はよくなっているしリアリティは増しているように思えるがサボテンのような何かにしかならず、植物系全般は様々なサボテンがcactusとして学習されていて存在しないものになっているのかもしれないです。というよりそもそもChatGPTのような質問に対して回答という使い方が間違っているのかもしれません。
風景的な素材は以前に比べるとリアリティが増していて使いやすいかもしれません。今のところ自分の活用レベルはLv0なのでプロンプトをきちんとかけておらずどのようなツールを使うにしろ修練が必要ですね。
Fooocusに関しては、パソコンにpythonがインストールされていれば、数クリックでPCのローカルでGPUを使って画像生成できるという点においては非常にお手軽なツールでした。