第二章:控制構圖
上一章介紹左用 google colab 起壇、透過 model,LoRA用 prompt, negative prompt 去 gen 圖片,呢章我主要講 gen 圖片嘅方法。
為左方便 gen 得快D,我以下過程會用「Euler (注意,唔係Euler a)」黎做 sampler gen 圖片,但如果係用黎製作「好似好真嘅圖片」,建議用「DPM++ SDE Karras」。
(A) 係你想 AI 做嘅野,啫係 prompt
(B) 係你想 AI 唔好做嘅野,啫係 negative prompt
(C) 係 Sampling Method,頭先講左,用 Euler 速度快,唔會用好多 GPU,同埋佢唔會太follow 你嘅指令,所以有時會有驚喜(both 優點 and 缺點)
一開始,我想要日本妹,所以我起 prompt 打 "Japanese Girl",結果:
佢冇錯,真係日本妹,但同我心入面想要嘅好好J嘅日本妹仲有好大距離,AI gen 圖嘅精粹係:
1. 訓練你講出心中所想
2. 叫佢唔好做嘅野,比叫佢做嘅野更加重要
我唔想要黑白相,唔要油畫,唔要太 3D 嘅塑膠圖,唔要手繪,呢D全部都要打落 negative prompt。
monochrome, 3d, sepia, painting, cartoons, sketch
得出以下結果:
唔 gen 阿嬤年代黑白相,咁我就講一講 prompt,呢個係我想叫 AI 做嘅野:日本妹去沙灘著住性感 bikini 奔跑緊。結果:
句野睇落冇問題,但點解 gen 出黎嘅好似咁普通,因為 AI 只係最低限度做你要求做嘅野(就係咁懶),所以你句野入面講嘅要求,佢全部做晒,冇做多,冇做少。
如果你要 Stable Diffusion (SD) 好精準咁 gen 你心入面想要嘅相片,就一定、一定要好詳細咁描述以下嘅野:
1. 現場環境 (Hawaii beach, blue sky, clear sky, summer)
2. 服裝 (sexy white bikini)
3. 人物特徵 (floating hair, sharp skin, light smile, fine skin detail)
4. 成品特徵 (ultra-detailed, photorealistic, super fine, (best quality)
結果如下:
開始似樣了,但仍然唔係好似一張相,呢個時候,就要出動括好 () 同埋 : 冒號:
a Japanese Girl, sexy white bikini, running, Hawaii beach, blue sky, clear sky, summer,
floating hair, sharp skin, light smile,
(photorealistic: 1.3),(nsfw:1), ultra-detailed, (fine skin detail: 1.2), (best: 1.0), (super fine: 1.0) , (best quality:1.4), (ultra highres:1.2),(8k, RAW photo:1.2)
() 括號啫係一定 SD 納入去計算嘅要求,: 1 係比重,0 係最細,唔通常 1/2 已經係最大,太大就會有反效果,例如 nsfw (not safe for work) 就係加D淫邪元素落去,(nsfw:1) 都幾淫,如果純粹少女味(nsfw:0.3) 已經好夠。
結果:
可惜隻手爛左:
繼續改善 Negative Prompt:
illustration, 3d, sepia, painting, cartoons, sketch, (worst quality:2), (low quality:2), (normal quality:2), lowres, bad anatomy, bad hands, normal quality, ((monochrome)), ((grayscale:1.2)), futanari, full-package_futanari, penis_from_girl, newhalf, collapsed eyeshadow, multiple eyebrows, vaginas in breasts,holes on breasts, fleckles, stretched nipples, gigantic penis, nipples on buttocks, analog, analogphoto, signatre, logo,2 faces, soft focus, hands, multiple belly buttons, big ass, big butt
(sorry 我唔鍾意大 pat pat)
其實 negative prompt 係萬用,基本上我砌好一 set 後,全部圖片都加同一 set
結果:
點解條女唔同左? 係,因為 Seed default 係 random,如果你見條女係你想要嘅 type,你就好 click 「回收」icon lock 左粒 seed 佢(甚至自己抄低,將來不斷使用)。
注意:用同一粒 seed 唔代表 SD 一定係用同一條女,就好似你每次叫AI 由沙田新城市廣場 (seed id) 出發買壽司,佢好少機會會去左旺角買,但唔代表佢次次都會去峰壽司買畀你。
如果你覺得構圖、女都幾好,最好就 copy 低全部資料,下次 base on 呢個再改。
隻眼死魚咁,點算?
唔怕,我地有 日本妹 LoRA!起 prompt 加入 <lora:japaneseDollLikeness_v10:0.3> ,將 sampler 轉做 「DPM++ SDE Karras」再 gen:
都係有D甩問甩骨,點搞? Easy,web UI 有個叫 Hires Fix (high resolution) 嘅功能,專門做高清修正:
我同一時間做埋放大,由 512x512 放大到 1024x1024
Upscaler 揀 「ESRGAN_4x」,呢個係最貼近真人影相。
結果如下:
(注意:web UI 有時 short short 地,gen 完圖片 UI 唔識更新,你去 Image Browser -> txt2img -> click 一下 first page 就會見到結果)
已經好貼近影相嘅效果,不過如果用黎出寫真,1024 x 1024 都仲係差D,同埋近睇都係差D「質感」,所以我接落黎做嘅,就係去翻閹呢張相,加入微粒、瑕疵,製造自然嘅質感。
去 Extra -> upload 返頭先 gen 果張相
Resize: 4
Upsclaer 1:ESRGAN_4x
GFPGAN visibility: 0.03 (製造D顆粒感覺)
最後結果 (4000px X 4000px):
可以睇到細節位有明顯改善,基本上已經足夠拎去印寫真。
========================
第二章節分享到呢度,希望幫到各位快速上手 SD。
建議:養成良好習慣,全部 txt2img gen 出黎覺得 OK save 低嘅相,都獨立 save 一個 prompt file,第時要用黎做 base 再 gen,或者修改都容易。