你在歇力分辦人類還是AI畫的?其實AI一直在做同樣的事(淺談GAN)
文:Jason Kong(JK)
回想起幾個月前,MidJourney AI畫寫實油畫風和超現實風的圖,震盪了西方場景美術界。可是,當時AI畫人體的能力還是很差,五官和身體全都是錯位和扭曲,大眾就言之鑿鑿的說「AI畫背景厲害而已,它畫不了人的!」不到一個月,AI突然掌握了寫實風的人體畫法了,臉孔也畫得愈來愈端正。大眾又說:「只是因為寫實光影容易被AI計算出來而已!日系二次元風格的話,AI是沒有那麼容易能模仿的!」
印象中好像還不到一個月左右,AI已經能畫出日系二次元風格了。先是日本推出了的mimic(ミミック)的AI,它可以模仿某個日系畫風的臉孔,然後畫出類似的風格,當時大量日本網民恐慌,害怕自己的畫會在沒有授權的情況下被拿去盜用,大家紛紛批評這AI根本是明目張膽鼓勵盜圖,於是這AI又很快承受不住網上輿論,立刻關站了。
可是,另一個AI「NovelAI」極速冒起,它比起mimic更厲害。透過輸入關鍵字,隨便創作出一幅又一幅如同真人二次元大手的作品。最近知名日本插畫投稿網站Pixiv,為了回應愈來愈多人使用AI作畫的情況,特地設置了AI美術的排行榜。為的就是防止別人用AI美術投稿到人類作畫的排行榜上。
網上很多人以為AI就是把別人的圖剪剪貼貼拼湊而成,所以直接就把AI理解為盜圖偷圖,認定它沒有創新的能力。讓我忍不住想在此說明一下。AI絕對不是「盜圖」和「拼接」那麼簡單,它絕對有創作能力,它的創作和學習方式是跟人類非常接近的。說到這個,我們現要了解所謂的AI art是怎麼來的。
AI的名字原本叫Machine Learning
AI art以前叫Generative Art。不知何時Machine Learning (機械學習)全部改稱為AI;procedual art或generative art又全部改稱為AI;把AI弄得神神祕祕,像是會統治人類那種智能一樣。去到現在,大眾居然以為AI就是偷圖剪貼,如果名稱繼續是用Machine Learning (ML)的話就不會有這誤解了。
形容Generative Art最佳例子是《No Man’s Sky》,遊戲設定中,宇宙裡每個星球都是用一堆參數生成出來的,任何動物、植物、礦石和環境,都是由不同的素材組合而成,玩家輸入參數後可自行構建無限的組合,當中也有十分漂亮的結果,反之亦然。
Procedural Art最佳例子就是Fractals。運用數式、規則和規律,創作者借電腦去生成有趣又好看的藝術作品。通常生成前都不知結果是怎樣,所以藝術家需要每次逐點逐點輸入參數,觀看結果後再修改,直至實驗成滿意的作品。對,就跟現在的AI art詠唱很接近。
Machine Learning,就是不依賴人類手動輸入參數,在設定好目標後任由它慢慢不斷嘗試錯誤,根據結果回饋再次調整執行方法,直至學習成功為止。經典的例子就是Boston Dynamic的四足步行機械人,它透過ML學習怎麼控制四肢活動和平衡,跌倒了即代表方法錯誤,成功走路就是方法正確,再不小心跌倒就再調整,不斷試行錯誤後慢慢就學懂走路了。
在辨識真偽之中進化
好了,當ML用在art上,「好看與不好看」跟「跌倒不跌倒」的狀況不同,「跌倒」有客觀定義,很容易判斷;但「不好看」就很難靠電腦自己判斷了。那programmer怎麼解決這狀況?他們研發了另一個專訓練審美的機械人,專門分辨AI art與人類藝術的相似度有多少,當ML art交給了審美機械人看,審美機械人就要判斷它究竟像不像人類藝術,不像的話就fail。
最近不是有一個「你能不能分辦人類art跟AI art」的問卷測試嗎?你需要每題觀察4幅畫作,判斷哪一幅是AI的作品。其實AI是在做一模一樣的東西,叫「生成對抗網絡(GAN-Generative Adversarial Network)」,一個AI負責製造AI畫,然後混進人類的畫中,再交給另一個AI判斷(discriminator),究竟那是人類畫的還是AI畫的,Generator AI要想盡辦法騙過Discriminator AI,讓它以為是人類畫的為止。
簡而言之,就是一個AI負責騙人,一個AI負責分辦真偽。
Discriminator會愈來愈聰明,Generator亦都會愈來愈厲害。這也是為何AI的畫會變得跟人類那麼難辨別,因為它們每秒中也在做這種欺騙遊戲的訓練。
必須說,ML是跟人類學習方式非常像:
- 必須有好的資料庫,資料庫的好壞你判斷不了,就正如AI一開始也判斷不了,所以就先信別人說好的經典、排行榜、高評分、熱門作品。
- Trial and Error,不斷嘗試錯誤。
- 連結事物的關聯性,構成自己的圖像聯想網絡。然後隨意結合,remix,這為之設計。
- Discriminator,比較自己作品和大師作品的相似地方,以及不相似的地方。
- Generator,盡量做到能騙過別人,分辨不出你的作品跟大師作品之間的差異。
對抗生成AI,會愈來愈準確理解keyword的意思,它創作的方向亦會愈來愈明顯。亦愈來愈懂把合適的元素組合起來,變成新的作品。
創作本身就是Remix
有人會提出:「AI只是不斷把過去人類創作出來的東西重新組合而已,根本就沒有原創可言。」我必須回答:「不,人類過去的創作,也是把過去的東西重新組合起來而已。」
看看現在日本動畫界和遊戲界是怎麼創作角色的,他們會在萌屬性資料庫中,找出合適的屬性,再用這些屬性組合成新的角色。例如「貓耳」、「眼鏡」、「女僕」、「殺手」這四個關鍵字組在一起,畫師就利用這些關鍵字聯想代表這些關鍵字的元素,再創作出新的角色。《水星的魔女》中的校服設計,是混了和服袖筒和傳統高達軍服設計而成的,傳統高達軍服則是參考二戰軍服,再加了當時很流行的80年代科幻風格而成。高達的激光劍、馬沙的造型、渣古的設計,所有元素都是來自Starwars的。1977年Starwars第一部電影面世,掀起全球狂熱,日本的高達便在兩年後1979年面世,繼續讓大家消費這個遠未來的太空科幻想像。那麼該說高達抄襲了Starwars嗎?我不認為是,它是用Starwars的元素混合了18米高的機械人,創作成新的東西。那Starwars是否就是真正的原創?也不是,因為Starwars這種星際故事,靈感是源自Dune的小說。Dune混合了中國武術,就變成Starwars了。
所謂的原創,其實都是Remix。就這定義而言,AI生成圖是跟人類一樣在做創作。甚至我覺得,AI比起人類能混搭出更多人類原本就沒有想過的組合,這是很多設計師都夢寐以求的能力。
人類的長處
先不要感到絕望,寫了那麼多,並不是想說AI可以完全取代人類,我是想大家了解AI的長短,再認識身為人類的你有什麼比AI優勝的地方。雖然它學習速度比你快十萬倍左右,但AI暫時沒有的是:
- 人生經驗,也即是你視點的角度和故事。
- 感情,也許AI有朝一日會產生感情,但現在能把感情放進作品的是你。
- 意志,AI是有創意的,它是會有自己的提案、主題和美術方向,英文即是motif, theme和direction,但我相信,主題的深度與執著,只有人類才有。就像把Dune抄成Starwars,把Starwars抄成高達那樣。那是仔細閱讀原作之後,每一個元素都經過深思熟慮的轉化,解決一個又一個的設計難題而成的。叫AI創作Starwars(武俠+太空科幻),它可能會直接把武俠楊過放到太空船上,但人類就懂得把武俠的「氣」轉化成「原力」,把鐵劍變成「激光劍」,把朝延的士兵變成「帝國軍」,因為人類才懂理解符號背後的意義,進行深度的轉化。
- 身為人的價值,不少讀者支持作品,也是為了支持背後那有血有肉的人,像是支持idol一樣。
了解以上的長處之後,就要取長補短。如果覺得自己學習方式進步很慢,就要研究一下AI是怎麼模擬人類學習的,那就是上段提到的GAN(生成對抗網絡):「騙子AI負責做出跟人類無異的畫,鑑定AI再負責找出哪張是AI的畫。」
換成人類的情況,你要嘗試畫出跟大師畫風無異的作品,然後再轉換成審視模式,審視自己跟大師有哪個地方不同,例如眼睛大小、五官比例、光影方法、人體結構等等。一開始你跟大師的分別當然非常之大,所以要像騙子AI那樣,不斷臨摹、分析、模仿,盡力嘗試畫出學習對象的畫風,然後把自己的腦袋切換成鑑定AI,找出自己跟學習對象的畫風不同的地方。你會發現,透過不斷的模仿和比較,你的審美會愈來愈高,眼睛會愈來愈容易分辦出不同畫風的差異,畫力也就隨之提高。
當你學習的對象超過一個人,你就可以開始嘗試混搭風格,加進不同的元素,發展成新的創作。學AI怎麼學習,你就會進步。畫畫是很用腦的,AI能用這方法建構網絡神經,你也能在腦內建構自己的網絡神經。光是畫畫不思考,就像2016年前的AI沒有生成對抗網絡(GAN)的Discriminator一樣,學習緩慢又沒有效果。如果把AI當作是我們的Discriminator,鞭策我們進步,努力不輸AI,那人類的審美會比以前進化得更快更高,因為生成對抗之中才有進步。
AI本應是人類的伙伴來的,它為我們帶來無限的組合靈感和創意,那能瞬間讓我們腦內的點子具現化。我們應該把自己當作是電影的美術指導,AI就是你旗下的員工。員工是幫助你實現腦內的幻想的,它能提供天馬行空的創意和無比漂亮工藝,可是,只有你才知道那套電影該怎麼呈視,那套電影有你跟情人美妙的回憶,員工不會清楚你跟女友約會那天是下雨還是下雪,穿的是黃色還是紅色,只有你才能把作品的感情和意義帶出來。不論你是純人類創作還是有使用AI工具創作,我們其實也一樣能從AI中學習,提高自己的辨認能力和審美,AI應是幫助我們進化,而非取代我們的。