[ AI Art ] - stable diffusion 討論分享 01

武吉士

1001 回覆

24 Like 8 Dislike

阿8 2023-03-13 14:23:08

根據上面段片既方法,dataset以
close-up頭像 3:1 半身/全身為主
至於train既野唔係時間多一定好,堆dataset要靚,中重點,同埋preprocessed gen出來果段prompt要準
面相最好多角度+唔同表情, 全身相就睇你係fullbody定cowboy shot,呢d都有分別

奇怪角度既角度多數gen 出來段prompt會有from behind, look at the viewer之類既tag, 咁就可以做到背住望後既動作, 但prompt又唔係越多越好,所以成段過程其實係trial and error

秋月無邊 2023-03-13 14:32:08

我見隨機性都好大，其實係咪控制唔到？

隨機性係可以好大，但要睇你prompt嘅實力去到邊
有啲model本身容許你用prompt去仔細調整某啲元素，例如鏡頭 (eg. photogenv22)

我搵到有人講可以落骨架，效果又係點

controlnet可以用pre-designed嘅pose去做output
效果係基本上一定會實現到，但目前好似未做到半身only嘅pose

果係啲背面，或者奇怪角度係咪做唔到

唔係，係做到，不過要睇本身個model有無train得夠多唔同角度嘅相
有啲model如果出背面，個樣會崩壞

秋月無邊 2023-03-13 15:01:48

我其實都唔太識點樣形容 lora, textual inversion 同 checkpoint 嘅關係

我嘅理解係：
lora, textual inversion感覺上似係微調，checkpoint就係個大腦
如果你喺只睇過動漫嘅大腦上面train一個真人model，你出嘅嘢都係動漫版嘅真人model

不過train lora我都唔係好在行，你最好問下啲有經驗嘅巴打

柱現(18碎) 2023-03-13 15:06:03

依啲我估係random

阿8 2023-03-13 15:24:29

prepossced只係read你張圖跟住幫你gen份tag出來,但入面好容易gen錯既野,所以如果你想result準就一定要簡單scan一次

根據bilibili一條大陸佬講,份野係可以反向操作,例如條女係長髮,啡眼,你如果del左個prompt咁你條女gen出來就好大機會係長髮啡眼.因為ai係份prompt搵唔到呢個原素,咁當你打返條女個名果陣,就會因為認定條女就係相裡面果個樣而gen返出來不過相對上想改條女d特徵效果就差d

迷途小股民 2023-03-13 15:31:15

想問我用8gb rtx 2080 super train唔train到lora