Q: 中間有踩坑嗎?
A: 有的,因為我們在做一件很新的事情,行業裡沒有什麼參考對象,只能不斷試錯。剛開始的時候,我們的數據不太夠,就制定了很強的設計規則去控制,結果就是機器要么跑不出設計結果,要么設計出來的結果很失控。設計是有無窮可能性的,靠弱數據強規則必然走不通。意識到這一點以後,我們就集中精力去解決數據問題,把內部設計師電腦裡的設計圖和供應商的設計圖都收集過來。
Q: 這麼多圖片散落在這麼多電腦裡,怎麼收集和整理啊?
A: 我們有自己開發的設計協同工具“設計板”,有點類似Slack(一款協作辦公應用),但是是專門用於設計協同的。這樣才能方便我們大批量、規模化的找到這些數據。
Q: 收集起來也還是很亂啊。
A: 是的,所以就遇到了第二個挑戰,就是數據清洗和輸入機器,因為收集過來的數據是很雜亂的。比如“雙11”期間“魔性”的設計風格跟無印良品這種“性冷淡”風格差異很大,這是完全不一樣的品牌調性和設計需求。我們花了很大的力氣去整理和建立了一套數據體系去管理設計數據,讓機器生產出更匹配的結果。
設計智能化
Q: 有人說“魯班”沒有達到設計人工智能的階段,只是“大數據生產”,您如何看待這個說法?
A: 現在講AI ,外界很難感受到機器的智能含量多高、體現在什麼地方,但我也不太同意“大數據生產”這一說,我覺得這個疑問涉及兩個核心的,也是最基本的問題:一是什麼叫設計智能,二是怎麼評價機器是否具備了設計智能。
AI 目前有幾個主要方向,一個是“識別”,像語音識別、圖像識別;另一個是“生成”,也就是我們在做的,從無到有創造東西,讓機器能根據請求生成符合特定要求的結果。我們把我們的智能設計定位為:可控的圖像生成技術。我們可以結合技術框架和原理來理解,我會在 UCAN 大會上詳細講。
Q: 那在這裡先給我們簡單講講?
A: 也可以。在整個生成過程中,有4個核心步驟。
第一步,讓機器理解設計是什麼構成的:我們通過人工數據標註,對設計的原始文件中的圖層做分類,對元素做標註。設計專家團隊也會提煉設計手法和風格。通過數據的方式告訴機器這些元素為什麼可以放在一起,我們把專家的經驗和知識通過數據輸入。這部分核心是深度序列學習的算法模型。
第二步,建立元素中心:當機器學習到設計框架後,需要大量的生產資料。我們會建立元素庫,通過機器做圖像特徵提取,然後分類,再通過人工控製圖像質量以及版權問題,我們買了有版權的圖庫,也是希望從一開始就避免版權方面的糾紛。
第三步,生成的系統:原理有點像 Alpha Go 下圍棋。我們在設計框架上構建起虛擬畫布,類似棋盤,生成的系統把元素中心的元素往棋盤放,在這裡我們採用了“強化學習”,就好像你在家裡放一台掃地機器人,讓它自己跑,跑個幾圈,它自己會知道哪裡有障礙要避開。在強化學習的過程中,機器參考原始樣本,通過不斷嘗試,得到一些反饋,然後從中學習到什麼樣的設計是對的、好的。
第四步,評估的系統:我們會抓取大量設計的成品,從“美學”和“商業”兩個方面進行評估。美學上的評估由人來進行,這方面有專業眾包公司;商業上的評估就是看投放出去的點擊率瀏覽量等等。
4個核心步驟
Q: 明白了,所以您覺得“魯班”的最大優勢是什麼?
A: 我覺得“魯班”是商業和技術兩方面的比較好的結合產物。首先在技術深度方面,它有門檻很高的一套系統,另外在商業方面,它的確能通過“智能化”和“個性化”,實現商業價值最大化,顛覆傳統方式。
Q: 聽說去年“雙11”,“魯班”設計了 1.7 億個 banner,你怎麼看這個“歷史事件”?
A: 其實這 1.7 億個 banner 是有設計強干預的,因為“雙11”的風格是比較確定而且需要嚴格執行,所以設計師製作了很多“雙11”特定風格的固定模板。機器在這個基礎上,把調整尺寸這些行為進行優化,節省了尺寸拓版的人力。用機器生成億級設計從而帶來商業效果提升,總體來說也是一次非常成功的應用實踐。我想未來的“雙11”仍然會是設計師帶著機器做設計的模式,重大活動中設計機器是提升效率的助理角色。
Q: 取得了這麼大的成功,阿里內部如何評價“魯班”呢?另外,“魯班”把 banner 都“擼”完了,原來做 banner 的人怎麼辦?
A: 引用阿里CEO 的話——“魯班是數據業務化的代表”,之前我們有很多數據,但都是閒置的或者利用效率不高的,比如海量的商品圖,而“魯班”把數據變成了業務,通過大規模設計加精準投放,提高每個廣告位的資源效率,帶動了流量的效率和業務價值,點擊率是翻倍的,收益也接近翻倍。人員倒沒有出現縮減,只是做的事情有調整了,要學習這套系統,學習如何訓練機器,同時在美學方面做把控。