根據上面段片既方法,dataset以
close-up頭像 3:1 半身/全身 為主
至於train既野唔係時間多一定好,堆dataset要靚,中重點,同埋preprocessed gen出來果段prompt要準
面相最好多角度+唔同表情, 全身相就睇你係fullbody定cowboy shot,呢d都有分別
奇怪角度既角度多數gen 出來段prompt會有from behind, look at the viewer之類既tag, 咁就可以做到背住望後既動作, 但prompt又唔係越多越好,所以成段過程其實係trial and error