Taggerの使い方
I will explain how to use Tagger.
Stable Diffusionの拡張機能であるTaggerは、画像のプロンプト(要素)を抜き出すことができる機能ですにゃ。
自動で要素を解析してくれるのにゃ。TaggerはStable Diffusionで生成した画像以外でも使るにゃ。
「このキャラの服装とか装飾の名前がわからんにゃ」とか「このシチュエーションはどうやってつくったらいいにゃ」みたいなときに解析してもらって、プロンプトを打ち込むときの補助にできるにゃ。
自分でLoRAを作成するのにも使えるにゃね。
いずれLoRAの作成も解説するからこれを機に導入するにゃ!Taggerの導入方法は、以下のリンク先で解説するにゃ。
まだTaggerの拡張機能をインストールしてない人は先に導入するにゃ。

Taggerの導入
画像に対してタグ(キャプションや説明文)を自動的に生成する機能を提供します。
How-To Guides
Step 1: Tagを表示したい画像の選択
今回は次の画像をベースにします。
Taggerタブを開き画像欄に解析したい画像を放り込みます。
...以上!
簡単すぎるにゃ。
画像のカメラと人物の特徴がかなり細かく認識されてるにゃ。
ただ、自動車、地上車両、水上バイクとかなんだか無いものがあるにゃ。
細かい背景などはなかなか難しいみたいにゃ。
逆に人物に関しては連想しやすいから判別しやすいのかもしれないにゃ。
例えば顔の上に乗っかってるから帽子だろうとか言った感じにゃ。
Step 2: タガーのタグ検出実験
今回試してみる内容は最初の画像生成で使用したタグがTaggerを通すとどうなるかにゃ。
元画像のプロンプトには物質だけではなくアクションも入れて作成するにゃ。
ある程度の精度を出すために同じプロンプトで8枚の絵を作成し、その中からタグを忠実に再現してる絵がどうなるかを試してみるにゃ。
プロンプト(主題、視線、服装、場所、構図、静物)1 cute girl, look away, Bunny Suit, Uyuni salt lake, dynamic angle, Coca-Cola,
どうなるのかドキドキなのにゃ。
特に動作や表情はどんな風に判断されるのかが気になるところなのにゃ。
5番の画像が一番プロンプトに沿った絵になったのでこの画像を使ってTaggerでタグを検出してみます。
1girl, animal ears, breasts, rabbit ears, solo, day, sky, outdoors, cloud, holding, ahoge, blue sky, white one-piece swimsuit, covered navel, bow, swimsuit, one-piece swimsuit, fake animal ears, bowtie, red hair, coca-cola, bare shoulders, bottle, ocean, standing, nail polish, white leotard, highleg, cowboy shot, water, contrapposto, looking away(よそ見), leotard, thighhighs, medium breasts, bangs, hairband, wrist cuffs, thighs, playboy bunny(プレイボーイバニー), holding bottle, short hair, cleavage, white thighhighs, detached collar(離れ襟), jewelry, lips, looking to the side(横を向く), red bow, skin tight, red nails, earrings, soda bottle(ソーダボトル), red bowtie(赤い蝶ネクタイ), hair between eyes, medium hair, skindentation
検出されたタグのうち最初の画像生成時のプロンプトに関するものがどうなったかを見ていきます。
looking at viewer → looking to the side, looking away,
Bunny Suit → rabbit ears, white one-piece swimsuit, animal ears, covered navel, bow, swimsuit, fake animal ears, bowtie, bowtie, bare shoulders, white leotard, highleg, leotard, bangs, hairband, wrist cuffs, playboy bunny, detached collar, red bow, red bowtie,
Uyuni salt lake → sky, outdoors, cloud, blue sky, ocean, water,
dynamic angle → contrapposto,
Coca-Cola → coca-cola, bottle, soda bottle,
こうしてみるとやはり容姿に関する情報が多くなるようです。
固有名詞であるコカ・コーラがそのまま認識してるところを見るとかなり精度が高そうです。
では、このタグを使って似たような絵が生成するかさらにこのプロンプトを使って8枚の画像を生成してみます。
この結果をみると最初の少ないプロンプトからTaggerを通して詳細なタグにすることで同じキャラクターの違う構図を作れそうです。
せっかくなのでコーラバニーをADetailerを使って綺麗にしていきます。
結果を見てみるとどんなプロンプトで作られたか分からない画像でもタグを調べることが出来そうにゃ。
なかなか優秀な拡張機能なのにゃ。
ホワイトバックの人物画像とかならだいぶ正確なタグを抽出できそうにゃ。
コークバニーさん画像の完成にゃ。