創新工場吳卓浩 《和孩子一起玩轉AI創造力》AI藝術家
AI藝術家(和孩子一起玩轉AI創造力系列)
吳卓浩 現任創新工場人工智慧工程院副總裁。跨界創新者,連續創業者,設計與科技教育者
吳卓浩先生長期從事產品與服務創新,自1998年開始軟體與硬體的使用者體驗設計,2013年開始服務設計,2010年開始空間設計,2017年開始人工智慧產品設計,並具有研發、運營、市場、商務等綜合團隊管理經驗。他曾服務和輔導過各個領域的成熟公司 和創業公司 ,擁有多項國內外產品發明專利 。
他是中國高等院校計算機基礎教育研究會網路科技與智慧媒體設計專業委員會副主任 ,北京設計學會服務設計專業委員會副主任 ,中國工業設計協會資訊與互動設計專業委員會委員 ,IXDC國際體驗設計協會委員 。他還是中國紅星原創獎及服務設計獎評委 ,聯合國非遺創新設計大賽評委 ,中國(北京)國際大學生動畫節白楊獎終審評委 ,天鶴獎國際創新設計大賽評委 ,中國使用者體驗設計大賽UXD Award評委 ,國際使用者體驗設計大賽好體驗獎評委 。
他的INWAY Design參與設計研發的自閉症兒童APP小雨滴,2015年獲得了UNICEF(聯合國兒童基金會)首批全球創新基金的資助 。他曾主持UNICEF-Tsinghua青年創新論壇 、UNICEF Global Innovations Summit的Scaling Small分論壇 ,還是CGTN科技創新相關節目的特約評論專家 。
2018年與吳卓浩老師一起參加中國傳媒大學舉辦的學術活動
AI時代正在到來,大量工作會被AI取代,人類將面臨前所未有的衝擊。如果說在以前,創造力是一種 nice-to-have 的能力,那麼在AI時代,創造力則成為人類追尋自身價值、必備的能力之一。
《和孩子一起玩轉AI創造力》是我正在寫的一本,給家長和孩子一起讀、一起玩的書,因為在不久將來,你和今天的孩子都將直面衝擊。跨界創新者、連續創業者、設計與科技教育者吳卓浩,以他獨特的視角,通過故事、案例、分析、以及可以直接上手玩的AI技術演示,帶你和孩子親身體驗AI帶來的種種變化,看一看、聽一聽、玩一玩、想一想,瞭解AI在各行各業中的應用情況與發展趨勢,結合經典的創造力研究成果,探索與AI相結合的創造力培養新方法,讓你重新發現孩子的發展可能性,並針對性的培養孩子的相關創造力,從而獲得通往AI時代的船票。
如果你有任何意見、建議,歡迎在知乎上聯絡我或給我發郵件:[email protected]
(以下長文預警)
AI藝術家(和孩子一起玩轉AI創造力系列)
歷史性的拍賣
大師再現
神筆馬良
機器人畫家
AI音樂家
戴爾·史普納警探(Del Spooner):“人類才會做夢,甚至狗也會做夢,可你不會,你只是個機器,你是對生命的模擬。一個機器人能寫交響樂麼?一個機器人能把一張畫布變成一幅美麗的傑作麼?”
桑尼(Sonny):“ 你 能麼?”
這是電影《我,機器人(I, Robot)》(2004)中經典的一幕,因為往事對機器人心懷芥蒂的警探和機器人桑尼爭辯,卻被桑尼反問的啞口無言。是的,藝術創造力是人類最了不起的能力之一:藝術能帶來直達心靈的愉悅,藝術能帶來發人深省的思考,藝術能帶來美觀實用的產品,藝術與科學的碰撞創造了人類燦爛的文明。然而,我們又不得不面對另一個現實:當我們小的時候,塗鴉、捏泥巴、拼樂高,儘管缺乏技巧,但是藝術創造就像呼吸一樣自然;然而當我們長大以後,絕大部分人既沒有掌握藝術創造技能,往往也失去了藝術創造的內心與動力。也許每個人都有藝術創造的潛力,但並不是每個人最終都能擁有藝術創造的能力。
那麼AI呢?
歷史性的拍賣
2018年10月25日,紐約洛克菲勒中心佳士得拍賣會,一幅畫作的拍賣吸引了眾多人的目光。通常的畫作都是由藝術家一筆筆畫出,而這幅畫是打印出來的;這幅畫最終竟然在同場363件拍品中,拍出了和畢加索的作品“Buste de femme d’après Cranach le Jeune”一樣的高價!這就是世界上第一幅在頂級拍賣行成功拍賣的AI畫作——“埃德蒙·貝拉米肖像(Edmond de Belamy, from La Famille de Belamy)”,拍價加上佣金一共432500美元,摺合人民幣大約300萬。此前也雖然有一些小交易,比如這個系列的第一幅畫作就以9000英鎊被人收購,但是這次拍賣還是創造了幾項第一:第一幅在頂級拍賣行成功拍賣的AI畫作,迄今價值最高的AI畫作。雖然金錢不等於一件藝術品的真正價值,雖然這幅作品還充滿了各種爭議,但是這次開創歷史的拍賣還是發出了一個清晰的訊號:對於AI的藝術創造,很多人是認真的。
【看一看】
埃德蒙·貝拉米肖像(Edmond de Belamy, from La Famille de Belamy)(2018)
建議使用:電腦/手機
建議年齡:全年齡段
Edmond de Belamy, from La Famille de Belamy
【想一想】
這個畫上畫的是什麼?
你見過類似的畫麼?
這幅畫有什麼特別,為什麼有人願意買它?
你會怎麼畫自己?
這件作品是怎樣產生的呢?一個來自法國,由藝術家和AI專家組成,叫“顯而易見(Obvious)”的藝術團體(obvious-art.com),利用AI技術創造了它。Obvious藉助一位叫羅比·巴拉特(Robbie Barrat)的AI藝術家在Github(github.com,程式設計師常用的程式碼託管平臺)上開源的演算法模型,用15000幅從14世紀到20世紀的肖像畫作為訓練素材,通過一種叫“GAN(Generative Adversarial Networks,生成對抗網路)[1]”的技術,生成了一系列畫作——貝拉米(Belamy)家族。有趣的是,之所以取這個姓氏,是因為拆開來正是“Bel Ami”,法語“朋友”的意思,而GAN技術的發明人伊恩·古德費洛(Ian Goodfellow)的姓Good Fellow就是好朋友的意思,Obvious以這樣的方式向GAN的發明人致敬。
【看一看】
貝拉米家族肖像(La Famille de Belamy)
建議使用:電腦/手機
建議年齡:全年齡段
https://obvious-art.com/gallery.html
【想一想】
這個家族有幾個人?
你最喜歡哪個人,為什麼?
這些畫有什麼相似、有什麼不同?
在你的家裡,你想畫誰?
感覺到這件作品的不同尋常了吧!不僅僅因為它是第一個拍賣的AI畫作,不僅因為它拍出了畢加索畫作一樣的高價,不僅因為圍繞它的種種爭議還遠未停息,更是因為它的產生過程在藝術史上前所未有:
- 跨越時間空間的合作:訓練這個AI的素材來自15000幅從14世紀到20世紀的肖像畫,所用到的基礎AI技術GAN由美國人AI大牛Ian Goodfellow發明,演算法模型基於一個高中畢業、搞藝術玩AI的美國小夥子Robbie Barrat,最終由藝術家和AI專家組成的法國Obvious落地生成了這件畫作。你能想象有機會跨越數百年的時間、世界各地,和從未謀面甚至不可能見面的人一起合作,共同創造藝術作品麼?AI給了你這樣的可能!無窮無盡的可能:Edmond不是這個AI生成的唯一畫作,理論上來說,這個AI可以創造無窮無盡的畫作;Obvious可以做,Robbie Barrat一直在做,任何人都可以去Github自由下載Barrat留下的原始碼、直接應用或者加以變化來做,還有更多人在利用GAN以及其他AI技術進行著藝術創作。通過調整訓練素材、演算法模型和引數,AI生成的作品就可能產生豐富的變化。你能想象有機會在很短的時間裡,嘗試各種藝術表現形式麼?AI給了你這樣的可能!藝術門檻再次降低:事實上藝術創作並不是人類的普遍現象,反而是隻有極少數有藝術天分的人類的小眾行為。但這不意味著人們就不喜歡藝術、不想參與其中。在人類歷史的發展過程中,尤其是資訊科技快速發展以來,越來越多的技術幫助普通人也能夠更好的進行藝術創造,比如智慧手機和照片編輯APP的出現,讓普通人也能成為攝影高手。你能想象沒有經過專業訓練,就可以用大師的手法作畫、甚至創造出屬於自己的風格麼?AI給了你這樣的可能!
當然,今天這樣的AI還有很多的問題,比如目前還需要創作者有一定的程式設計能力,生成的圖片的畫質上還有比較多限制,需要非常大量的訓練素材、並且要改變風格就要重新訓練AI,以這種方式是否能夠產生原創還飽受爭議……更關鍵的是,在今天,即便生成了讓人讚歎、藝術感十足的藝術作品,AI也並不是真的“懂得”畫面上究竟表達的精神層面的內容是什麼,只是生成了形式、卻並不懂其內涵。但是,只要想到能夠和人類社會最精華的智慧進行跨越時間空間的合作,能夠以很低的成本嘗試大量的可能性,讓藝術創作不再只是極少數人的專利,這樣的AI藝術助手甚至AI藝術家,難道不令人激動?:D
人們用電腦進行藝術創作的嘗試可以上溯到1960年代[2],但是因為長期以來人們並沒有找到特別行之有效的讓AI處理視覺影像的辦法,直到李飛飛博士發起建立ImageNet[3]計算機視覺資料集,並從2010年開始進行年度程式設計競賽,才讓計算機視覺技術進入突飛猛進的快速發展期,各種難關不斷被攻破。隨後不久,藝術家就開始把最新的AI技術應用於藝術創作,比如基於2014年發明的GAN(其技術源頭可以上溯到1990年代[1],又如基於2015年釋出、並隨後開源的DeepDream(其技術源頭可以上溯到1980年代末[4]。DeepDream的作品因為風格奇異,很多不適合小孩子觀看,在此不做展示和討論)。讓我們看看,今天的AI在藝術創作上做了些什麼。
大師再現
給AI足夠的畫作作為學習素材,通過“影象風格遷移(Neural Style)”[5]技術,AI就能掌握相應的繪畫風格,並能把它應用到另一張圖片上。你就可以把你拍的照片、畫作、甚至視訊,用藝術大師的風格重新繪製,彷彿大師再現。很多人是從照片藝術風格化APP“Prisma”開始瞭解和使用AI的,一鍵把照片變為繪畫風格,頓時品味滿滿。
還有一些能夠做影象風格遷移的網站,同樣精彩。Deep Dream Generator至今仍然全免費,Deep Art不僅能處理圖片還能處理視訊,Ostagram上有一些獨特有趣的效果、比如用麵條重現照片的“麵條風格”。美國麻省理工大學(MIT)於2016年推出了一個生成恐怖圖片的AI“Nightmare Machine”[6],不過不適合帶孩子觀看。圖形影象處理的行業巨頭Adobe在2017年10月的“Adobe MAX 2017”大會上演示的“Puppetron”的技術[7],將人的頭像轉換為特定的藝術風格,並能實時控制、生成視訊,也很令人期待。
【玩一玩】
照片藝術風格化:Deep Dream Generator(三個網站中,這個的圖片處理速度最快)https://deepdreamgenerator.com/
Deep Art:https://deepart.io
Ostagram:https://www.ostagram.me
建議使用:電腦/手機
建議年齡:全年齡段
【想一想】
瀏覽網友的作品,你最喜歡哪個,為什麼?
處理自己的照片,你最喜歡什麼效果?
處理風景或物品的照片,你最喜歡什麼效果?
這些效果是按照怎樣的規律轉化你的照片的?
這些AI能夠把照片迅速變為精彩的畫作,娛樂之餘,也不由得引人思考:如果能如此輕鬆的生成效果十足的畫作,那麼我們還要學習繪畫的技巧麼?
繪畫技巧從來不是目的,而是手段,鍛鍊觀察、思考與表達的手段。印象派大師莫奈大約畫了250幅“睡蓮”主題的油畫[8]來追尋自己想要的藝術,這些畫作每件都成為莫奈以及印象派藝術之路的重要組成部分;而深圳大芬油畫村的畫師,在摹畫出數萬張梵高的畫作後,技藝雖然已經無比純熟,卻仍然完全無法擁有屬於自己的藝術家的觀察、思考與表達能力。一方面,使用AI將內容與風格相融合,生成大量的嘗試成果,有助於我們直觀的瞭解藝術豐富的可能性,幫助我們開闊思路,而不是像在很多美術培訓班裡那樣被“標準範畫”禁錮住;另一方面,使用風格遷移技術生成的畫作中能夠清晰的觀察到形式、技法是如何為內容服務的,這樣不僅有助於我們更好的理解和掌握繪畫風格與技法,而且有利於引導我們去思考內容與形式的關係,如何建立自己的創作思路,並逐漸形成自己的藝術風格。在此基礎之上,再多動手,把觀察、思考、表達結合起來,就如同歷史上的大師出現在我們面前,向我們示範他們會如何創作我們的內容,幫助我們迅速成長。
【看一看】
CycleGAN技術實現的影像轉換[9]:繪畫與照片互轉、馬與斑馬互轉、冬夏互轉(2017-2018)
建議使用:電腦
建議年齡:全年齡段
https://github.com/junyanz/CycleGAN
【想一想】
馬和斑馬的區別是?
怎麼把馬的照片變成斑馬?
夏天和冬天景物的區別是?
把夏天的照片變成冬天,主要是改變什麼?
神筆馬良
AI科學家向著創造“神筆馬良”的目標持續努力,讓我們能夠通過簡單的塗鴉就得到逼真的、高質量的影像,並且正在取得讓人驚訝的成果:
在NVIDIA 2018年12月公開的“vid2vid(Video-to-Video)”[10]技術演示與論文中,我們可以看到,由原始視訊、簡筆畫視訊或者色塊構成的視訊,經過AI的處理,能夠生成宛如真實影像的高清視訊。並且由於是AI生成的影像,可以很方便的變換成完全不同的視覺風格和內容,比如變換人的膚色和髮色、變換道路兩側的建築和景色。
【看一看】
NVIDIA vid2vid的視訊生成(2018)
建議使用:電腦
建議年齡:全年齡段
https://github.com/NVIDIA/vid2vid
【想一想】
由AI生成的視訊,在哪些地方和原始素材不同?
這些生成的視訊之間有什麼不同?
哪裡看起來不像真實的世界?
要生成不同的視訊,主要是在哪些地方做區別變化?
僅僅在三個月之後,2019年3月,NVIDIA又公開了“GauGAN”[11]技術演示與論文,展示了由簡單的線條和色塊塗鴉,生成栩栩如生的風景照片。
【看一看】
NVIDIA GauGAN以塗鴉生成逼真的圖片(2019)
建議使用:電腦
建議年齡:全年齡段
https://nvlabs.github.io/SPADE/
【想一想】
左邊的塗鴉和右邊圖片有什麼相似、有什麼不同?
怎樣讓AI知道你畫的這筆要變成什麼?
AI把塗鴉變成照片有什麼訣竅?
你想用這項技術做什麼?
【玩一玩】
用GANpaint[12]在照片上“無中生有”(2019)
建議使用:電腦/手機
建議年齡:全年齡段
https://gandissect.res.ibm.com/ganpaint.html
【想一想】
怎樣告訴AI你要在照片上增加什麼?
不同的東西增加在哪裡更合適?為什麼?
不同的東西增加在哪裡顯得更真實?為什麼?
怎樣用廢舊報紙或雜誌,剪貼拼出新的圖片?
漫畫自動上色也是一個非常有意思的領域。我們平時看到的漫畫,很大一部分是黑白漫畫,最主要的原因就是上色是個非常耗時耗力的過程;漫畫的2D動畫版往往畫質大幅下降,也是由於在畫面增加、又要上色的情況下,工作量大幅上升,如果要維持原畫的畫質,所需要的投入人力就會大到讓團隊無法承受。而對於普通人來說,畫一些線條的塗鴉還是能做到的,可是一旦上色,就會變得慘不忍睹,畢竟色彩的運用不僅需要天賦、也需要專門的學習和訓練。如果只要畫出漫畫線稿,稍作定義就能生成彩色的版本,將會大幅提升創作效率,也能幫助更多普通人畫出漂亮的圖畫。比如在PaintsChainer,上傳線稿圖片,再稍微通過描繪彩色線條來指定塗色的顏色、範圍,就能生成一張上完色的漫畫。
【玩一玩】
用PaintsChainer為漫畫上色
建議使用:電腦/手機
建議年齡:7歲以上(需要孩子對細節有較好的思考力和控制力)
https://paintschainer.preferred.tech
【想一想】
找一張只有線條的卡通畫上傳,試試預設上色效果,你喜歡哪個?
開始上色,怎樣告訴AI哪裡用什麼顏色?
怎樣細緻的控制各處的顏色?
自己畫一張卡通,用AI上色!
現在AI不只可以為靜止的漫畫上色,還有更多的動漫玩法。2018年,美圖秀秀推出了“動漫化身”功能,能直接把你變身為卡通形象,並且你可以控制這個卡通形象,做成視訊或者表情包;同年,快手推出了“萌面”功能,讓你瞬間變身卡通形象,實時控制這個形象的面部表情和動作,還能定製自己的卡通形象。
【玩一玩】
用美圖秀秀APP生成動態或靜態的動漫形象
(點選APP中的“美圖AI”圖示進入,選擇相應的欄目)
建議使用:手機
建議年齡:全年齡段
https://mt.meipai.com/
【想一想】
“動漫化身”為你生成的卡通形象,像不像?
你能控制這個卡通形象做什麼?
用“繪畫機器人”為自己畫卡通像,你最喜歡哪個,為什麼?
給自己畫一張卡通畫,和“動漫化身”、“繪畫機器人”的效果比一比,各有什麼特點?
【玩一玩】
用快手APP讓自己瞬間變身卡通形象
(點選APP中的圖示:“攝像”à“魔法”à“萌面”,選擇自己喜歡的卡通形象,或者創作專屬萌面)
建議使用:手機
建議年齡:全年齡段
https://www.kuaishou.com/
【想一想】
你最喜歡哪個卡通形象?
你能控制卡通形象做什麼?
可以從哪些方面定製自己的卡通形象?
不同卡通形象之間的相同的是什麼、不同的是什麼?
機器人畫家
藝術家也和AI科學家一起探索機器人畫家的可能,既有實體機器人,也有軟體機器人(電腦程式)。其中最著名的嘗試之一,是哈羅德·科恩(Harold Cohen)和他的繪畫機器人阿倫(AARON)[13]。自AARON於1973年問世,到Cohen於2016年去世,Cohen和AARON一起合作了整整40年。Cohen是電腦藝術[2]、演算法藝術[14]、生成藝術[15]的先鋒,不過他自認為“首先且最主要是個畫家”;他同時也是個了不起的工程師,他的工作定義了第一代電腦藝術。
【看一看】
Harold Cohen與AARON:首次彩色繪畫創作(1995)
建議使用:電腦/手機
建議年齡:全年齡段
https://www.computerhistory.org/atchm/harold-cohen-and-aaron-a-40-year-collaboration/
【想一想】
繪畫機器人需要有哪些部分構成?
繪畫機器人可以怎樣畫畫?
怎麼教繪畫機器人畫畫?
機器人自己知道想要畫什麼麼?你呢?
除了AARON,還有很多其他的繪畫機器人,比如CloudPainter、the Painting Fool、eDavid、PumaPaint,華人藝術家鍾愫君(Sougwen Chung)還用機器人和自己一起協同創作。有的繪畫機器人模仿人的作畫方式,也有的努力發掘機器的特點。網際網路創業家安德魯·康魯(Andrew Conru)在2016年發起了每年一度的“機器人藝術大賽(Robot Art Award)”,每年都收到大量來自全球機器人畫家的作品。
【看一看】
維也納技術大學(TU WIEN)的繞線畫(string art)機器人(2018)[16]
建議使用:電腦/手機
建議年齡:全年齡段
https://v.qq.com/x/page/c07240h7lkz.html
【想一想】
視訊裡出現了哪幾種繪畫機器人?
你最喜歡哪種機器人,為什麼?
用繞線作畫的方式,難在哪裡?
機器人和人畫畫的方式有什麼相同,有什麼不同?
【看一看】
機器人藝術大賽(Robot Art Award)
建議使用:電腦/手機
建議年齡:全年齡段
https://robotart.org/
【想一想】
你最喜歡哪些作品?為什麼?
這些機器人的繪畫作品有什麼特點?
為什麼要機器人畫畫?
在哪些方面你能比機器人畫畫更好?
【看一看】
鍾愫君(Sougwen Chung)和機器人一起協同創作
建議使用:電腦/手機
建議年齡:全年齡段
https://sougwen.com/
【想一想】
你最喜歡她的哪幅作品,為什麼?
她有幾種不同的機器人協助她作畫?
你希望有一個怎樣的機器人和你一起畫畫?
可以請家人假扮成機器人和你一起畫畫麼?
在淘寶上搜“畫畫機器人”,能找到不少:有不可移動的機械臂,也有可移動的小車;有需要自己程式設計控制的,也有傻瓜式直接在手機上寫寫畫畫控制的。價格從幾百元到幾萬元不等,可以試試。在此之前,可以先帶孩子在手機和電腦上體驗一下這幾個懂繪畫的軟體機器人:
【玩一玩】
猜畫小歌:你畫畫,AI猜
微信搜尋小程式“猜畫小歌”
建議使用:手機
建議年齡:全年齡段
【想一想】
AI是怎麼猜出我畫的是什麼的?
AI有在向我學習麼?
AI學會了很多簡筆畫,可以做什麼?
排行榜上有哪些朋友,問問他們畫簡筆畫有什麼竅門?
【玩一玩】
Magic Sketchpad:AI和你一起畫簡筆畫
建議使用:電腦/手機
建議年齡:3-6歲
https://magic-sketchpad.glitch.me/
【想一想】
AI和你一起畫出有意思的畫了麼?
你最喜歡和這個AI一起畫什麼?為什麼?
人和這個AI怎樣配合才能更好的畫畫?
可以請家人假扮成AI和你一起畫畫麼?
AI音樂家
2017年,美國女歌手泰琳·薩頓(Taryn Southern)帶來了世界上第一張AI作曲和製作的流行音樂專輯《我是人工智慧(I AM AI)》[17]。準確的說,是Taryn和AI一起協作創作音樂:Taryn首先大致構思一個音樂以及和絃的結構,然後告訴AI她想要的拍子數(BPM)、樂器、音樂風格(genre)、音樂的調(key)等等,AI就會輸出一段音樂,供她反覆調整,直到滿意為止。這樣逐步得到越來越多的成果,填入音樂的結構中,然後她再寫出人聲的旋律和歌詞。
她覺得使用AI創作最大的好處,是無需具有深厚的音樂和樂器知識,AI會幫忙生成各種音樂和組合,只要有一雙好耳朵,能聽出、選出自己最喜歡的音樂,就能搞定作曲。而且AI帶來豐富的嘗試,常常能激發她更多的想法。比如原本她從未想過要在音樂中使用那種電影大片式的恢弘音樂因素,但是AI根據她的要求生成出的音樂中有這樣的片段,她聽起來感覺不錯,就把它放入了自己的音樂。她最初使用的AI音樂創作平臺是Amper Music(ampermusic.com),因為相比其他的AI音樂創作平臺,比如IBM的Watson Beat、Google Magenta的NSynth Super、Jukedeck、Melodrive、Spotify的Creator Technology Research Lab、AIVA,Amper Music使用起來更簡單。
【聽一聽】
Taryn Southern和Amper Music創作的《Break Free》(2017)
建議使用:電腦/手機
建議年齡:全年齡段(還請注意她有一些歌曲不適合孩子)
https://y.qq.com/n/yqq/mv/v/x002418o4we.html
【想一想】
你喜歡這首歌麼?喜歡哪裡?
這首AI音樂和你平時聽到的音樂有什麼不同麼?
試試自己作個小曲,你覺得有什麼困難?
你希望AI怎麼幫助你?
喜愛音樂的科學家在AI音樂方面的探索要比很多人以為的要早得多,早在1950年代就已經開始[18],幾乎和人工智慧概念的提出是同步的。而第一張完全由AI作曲的專輯,至少可以追溯到2012年由音樂AI“IAMUS”帶來的同名專輯《iamus》[19],Taryn的專輯名稱《IAMAI》彷彿就是在向它致敬。
1958年,萊賈倫·希勒(Lejaren Hiller)和萊納德·艾薩克森(Leonard Isaacson)在伊利諾伊大學音樂學院,用ILLIAC超級計算機(Illinois Automatic Computer)進行了開創性的實驗音樂工作。
1974年,蓋裡·瑞德(Gary M. Rader)巧妙的運用音樂原理,通過設定音樂規則進行創作。[20]
1981年,“人工智慧之父”馬文·明斯基(Marvin Minsky)發表論文“音樂,心智與意義(Music, Mind, and Meaning)”[21],探討了音樂是如何感染人心的。
1984年,克里斯托弗·福萊(Christopher Fry)發表了用AI進行即興音樂創作的成果“Flavors Band”[22]。
1980、1990年代,大衛·柯珀(David Cope)所做的“音樂智慧實驗(Experiments in Musical Intelligence)[23]”,讓AI能夠模擬他自己以及多位音樂大師的風格作曲。
1997年,約瑟夫·路易斯·阿科斯(Josep Lluís Arcos)等人所做的Saxex系統[24],讓AI生成的薩克斯音樂更具情緒表現力,並在後來發展為TempoExpress[25]。
2010年,首個不是模擬、而是創作自身風格的音樂AI“IAMUS”帶來了音樂片段《一號作品(Opus One)》,並於2011年帶來了首個完整曲目的創作《世界你好(Hello World)》,於2012年帶來了首個AI創作的音樂專輯《iamus》[19]。
2013年,東京大學打造的全機器人樂隊Z-Machines公演,由78根手指的吉他手、22根手臂的鼓手、一邊演奏一邊從眼睛裡發射鐳射光的鍵盤手,演奏英國音樂家Squarepusher幫助他們以AI創作的音樂;2014年Squarepusher和Z-Machines還聯合推出了包含5首音樂的小專輯“致機器人的音樂(Music for Robots)”。
2016年,索尼CSL(Sony Computer Science Labs)運用他們的AI音樂軟體FlowMachine,相繼推出了世界上第一首AI作曲的流行音樂、模仿披頭士風格的“老爸的車(Daddy’s Car)”,以及模仿巴赫風格的AI程式DeepBach。另一個AI音樂平臺AIVA(aiva.ai)則帶來了它的首張專輯《創世紀(Genesis)》。
2017年,Taryn Southern用Amper Music帶來了第一個AI作曲並製作的流行音樂專輯《I AM AI》。AIVA(aiva.ai)帶來了第一支以AI為視訊遊戲創作的音樂《Pixelfield, Battle Royale》,並於2017年通過了法國作曲家協會( SACEM )的資格認證、成為人工智慧領域首個獲得國際認證的虛擬作曲家,還在2018年創作了一張中國風的專輯《艾媧》(如果你英文好且能訪問Medium網站,還可以檢視AIVA詳細介紹《艾媧》的創作過程:https://t.cn/EithzVf),很有意思。你會了解到人類是怎樣和AI合作進行音樂創作,其中有各種神奇的變化,但又不是一下就由AI完全獨立生成美妙的音樂。
【聽一聽】
Saxex生成具有情緒表現力的音樂(1997)
(試聽內容在頁面下方)
建議使用:電腦/手機
建議年齡:全年齡段
https://www.iiia.csic.es/Projects/music/Saxex.html
【想一想】
你對每段音樂的感覺是什麼、有什麼不同?
哪段音樂你更喜歡,為什麼?
【聽一聽】
音樂AI“iamus”創作的《opus one》(2010)和《Hello World》(2011)
(試聽內容在頁面中間位置)
建議使用:電腦/手機
建議年齡:全年齡段
https://en.wikipedia.org/wiki/Iamus_(computer)
【想一想】
聽到這兩段音樂,你的感覺是什麼?
它們和你平時聽到的音樂感覺有不同麼?為什麼?
【聽一聽】【看一看】
全機器人樂隊Z-Machines(2013)
建議使用:電腦/手機
建議年齡:全年齡段
https://www.vice.cn/read/for-some-reason-zima-sponsors-a-78-fingered-robot-guitarist
【想一想】
你看到三個機器人了麼?它們什麼樣?
機器人的演奏和人的演奏有什麼不同?
他們是自己獨立演奏,還是有什麼在控制他們?
如果你來設計音樂機器人,會是什麼樣呢?
【聽一聽】
FlowMachines的Daddy’s Car(2016)
建議使用:電腦/手機
建議年齡:全年齡段
https://v.qq.com/x/page/g03651hkzri.html
【想一想】
你有沒有挺過類似風格的音樂?
為什麼這支音樂似曾相識?
【聽一聽】
AI作曲平臺AIVA的音樂作品(2016至今)
建議使用:手機
建議年齡:全年齡段
https://y.qq.com/n/yqq/singer/003tWEQs1Wiivs.html
【看一看】
創始人介紹AIVA是如何作曲的(2018)
(播放時可開啟中文字幕)
建議使用:電腦/手機
建議年齡:7歲以上,有英文聽力或中文閱讀能力
https://www.ted.com/talks/pierre_barreau_how_ai_could_compose_a_personalized_soundtrack_to_your_life
【想一想】
AIVA這些音樂中,你最喜歡什麼?為什麼?
AIVA的音樂和平時聽到的音樂有什麼不同?
聽音樂的時候閉上眼睛,你“看”到了什麼?
如果為你最喜歡的玩具配一段音樂,你希望裡面有什麼感覺、形象?
是不是很神奇?想試試AI輔助的音樂創作?可以先體驗一下這幾個:
【玩一玩】
用蘋果“音樂備忘錄”APP快速作曲
(點選錄音,哼唱或者彈奏一段小曲,然後它就能自動配上貝斯和架子鼓,形成最基礎的音樂)
建議使用:iPhone、iPad
建議年齡:全年齡段
https://www.apple.com/cn/music-memos/
【想一想】
點選錄音按鈕,自由發揮或者哼唱一段自己熟悉的音樂 。
你的哼唱加入貝斯、架子鼓以後,感覺有什麼變化?
你覺得自己創作一段音樂難麼?難在哪裡?
你希望AI幫你做什麼?
【玩一玩】
用Latent Loops創作電子音樂
(以簡單直接的方式作曲:畫點、畫線生成音樂片段,拖拽進行組合)
建議使用:電腦
建議年齡:7歲以上
https://teampieshop.github.io/latent-loops/
教學動畫:https://static.leiphone.com/uploads/new/article/740_740/201804/5ad8765ba4f10.gif
【想一想】
圖形畫線是怎樣變成聲音的?
怎樣的節奏好聽?
怎樣的音階組合好聽?
怎樣的音樂片段連線在一起好聽?
越彈越美妙的鋼琴精靈:PIANO GENIE
(即使你不會鋼琴,只要像模像樣的演奏,過一會兒,音樂就會越來越美妙,因為AI在背後悄悄的幫你,通過預測下一步的音階組合,讓8個鍵的彈奏變為88個鍵的彈奏。注意,雙手彈奏效果更好)
建議使用:電腦/手機
建議年齡:全年齡段
https://piano-genie.glitch.me/
演示視訊:https://v.qq.com/x/page/t0754wnbp7m.html
【想一想】
當你敲擊一個鍵,什麼情況下聲音是不變的,什麼情況下聲音是變化的?為什麼?
AI是怎麼幫助你把8個鍵的演奏變為88個鍵的演奏?
彈一個你熟悉的曲子,會發生什麼?
……
近年來AI技術突飛猛進,在藝術領域中的應用也越來越多。當我們面對這些AI,有的人發出感嘆、疑問、甚至擔憂:AI真的已經進入了人類創造的核心領域,可以進行藝術創作了麼?還有一些人則認為:AI只不過是在對人類的藝術創造進行模仿,即便成果看起來和人類的藝術創作非常接近、甚至無法區分,但它們根本不知道自己在做的是什麼。
事實上,今天的AI的確還不具備原創藝術的能力。目前AI藝術創作主要基於幾種機器學習技術,通過把大量人類藝術作品(“資料集”)“喂”給機器(“學習”),讓機器找到資料之間的關聯性,並建立起相應的模型,從而以產生新的關聯組合、有的還會加以篩選的方式,創造出新的藝術作品。從結果上看,AI的藝術創作成果在過去幾十年間獲得了顯著的進展,有很多AI的藝術創作在表現層面已經和人類藝術家的作品難分伯仲;但是,由於AI並沒有辦法在事物的社會、精神含義層面真正產生理解,所以它並不知道被“喂”給它的東西擁有什麼含義,也無法在生成的藝術品中加入任何含義。就像一個有語音天賦的歌手,可以在完全不懂一門外語的情況下,惟妙惟肖的演唱外文歌曲;甚至可以按照一門外語的發音規則,編出“土豆哪裡去挖?土豆郊區去挖。一挖一麻袋?一挖一麻袋”這樣,聽起來酷似外語,但實際沒有任何意義的內容。
但我們完全沒必要在現在就對AI未來的藝術創作能力下判定。人類那些最偉大的藝術家們,都是從模仿開始,逐漸找到了自己藝術創作的方法、理念和靈魂。比如,如果我們去聽巴迪·霍利(Buddy Holly)[26]的音樂,會發現披頭士樂隊的作品、尤其是早期的作品,有很多對他的音樂的模仿。但這並不妨礙披頭士樂隊最終找到自己的道路,成為偉大的音樂團體。西方中世紀藝術家對於古希臘藝術的追溯帶來了文藝復興,現代藝術對於非洲藝術的再發現則帶來了野獸主義、立體主義、表現主義、抽象主義以及超現實主義等多種現代、當代藝術思潮。未來AI能否跨越單純的模仿、無意識的組合,將直接決定AI是否能獲得原創藝術的能力。
無論AI能否獲得藝術的原創能力,AI技術的發展都將對於藝術創作有著極其重要的意義。人類藝術的發展史,就是一部思想與技術碰撞的歷史。數萬至數十萬年前,人們對生活的思考與礦物顏料的發現相結合,帶來了史前巖畫藝術;4000年前(公元前21世紀),人們對社會制度的思考與冶煉技術的發展相結合,帶來了青銅器藝術;3000年前(公元前10世紀),人們對自然、社會的思考與石雕技藝的發展相結合,帶來了古希臘雕塑藝術;600年前(公元14世紀),人們對現實的反思和對古希臘羅馬復興、創造,與幾何透視法、人體解剖等科學發展相結合,帶來了文藝復興運動;160年前(1859年-1910年),人們對大工業生產的反思與大工業生產相結合,帶來了工藝美術運動;150多年前(1860、1870年代),人們對當時保守的學院派的反對,與色彩理論的發展相結合,帶來了印象派運動,推動了之後世界範圍內美術技法的革新與觀念的轉變;140年前以來(1879年以來),各種前衛反叛的思潮,與高速發展的現代科技、複雜的社會變化相結合,帶來了現代主義藝術。而今天,AI技術走上了舞臺。
AI技術對於藝術創造的重要意義,不僅在於做法層面,更在於思維層面:
跨越時間、空間、領域的協作創造。比如就像第一幅在頂級拍賣場成功拍賣的AI畫作《Edmond de Belamy》,跨越時間、空間、藝術與科學領域,由14世紀至今、歐美各地的藝術家、AI專家協作創造,並且核心的演算法模型、資料集都是開放的。只是因為目前還需要程式設計處理,只有少數人能夠參與這樣的創造過程。但是相信很快就會有包裝好的產品,讓每個普通人,無論是否懂技術,都可以方便的使用,參與這樣跨越時間空間的協作創造。AI的機器特質,既是一種限制,目前讓它無法像人一樣去獲得創造的思維躍遷,但另一方面也會帶來超出人類能力甚至理解力的新方法、新過程。
充分擁抱可能性的創造。只要建立合適的演算法模型、給予充足的計算資源,AI能不知疲倦、不墨守成規、卻又高效專業的,對各種方向、各種可能性進行近乎窮盡的探索。就像AlphaGo能發現人類圍棋三千年從未想過的走法,AI的藝術創造潛力不僅能帶來效率的提升,甚至可能帶來突破邊界的創新。
大眾化賦能的創造。AI技術讓藝術創造能夠有更多普通人蔘與,而不是少數經過專業訓練或天賦異稟的人的專利。人類天生具有想象與表達的慾望,但是隨著社會化的成長,絕大部分人事實上既無法建立起所需要的專業技能,又因為種種原因失去了藝術想象與表達的慾望。AI技術能大幅降低藝術創造的技能門檻、讓人無需卡在這裡,產生大量可能性的嘗試、供人選擇,由此更會激發人們藝術創作的動力和慾望。參與藝術創造的人數量更多了,型別更豐富了,也會相應帶來更多新的、有意義的變化。
人類對於藝術的理解與創造,將不會被削弱,而是更加強。我們也許不再必須要十年如一日的去學習、打磨藝術創造的技藝,但是仍然需要好眼睛、好耳朵、好腦子、好心靈。用好眼睛、好耳朵去分辨,用好腦子去思考,用好心靈去追尋。
回到本章開始時,電影《I, Robot》裡Spooner和Sonny的對話,關於藝術創造:
“你 能麼?”
當然,有AI幫助,我當然能。
如果你有任何意見、建議,歡迎在知乎上聯絡我或給我發郵件:[email protected]
參考資料
[1] GAN(生成對抗網路,Generative Adversarial Networks). https://baike.baidu.com/item/Gan/22181905,https://www.zhihu.com/topic/20070859,https://en.wikipedia.org/wiki/Generative_adversarial_network
[2] Computer Art. https://en.wikipedia.org/wiki/Computer_art
[3] ImageNet. https://baike.baidu.com/item/ImageNet,https://en.wikipedia.org/wiki/ImageNet
[4] DeepDream. https://baike.baidu.com/item/DeepDream,https://en.wikipedia.org/wiki/DeepDream
[5] 李嘉銘. 2018. 影象風格遷移(Neural Style)簡史:https://zhuanlan.zhihu.com/p/26746283
[6] MIT. 2016. 生成恐怖圖片的AI“Nightmare Machine”. https://nightmare.mit.edu
[7] Adobe Puppetron. 2017. https://research.adobe.com/news/puppetron-your-face-as-a-stylized-work-of-art/
[8] 印象派大師莫奈的250幅“睡蓮”. https://en.wikipedia.org/wiki/Water_Lilies_(Monet_series)
[9] 朱儁彥. 2017-2018. CycleGAN. https://github.com/junyanz/CycleGAN
[10] NVIDIA. 2018. Vid2vid. https://github.com/NVIDIA/vid2vid
[11] NVIDIA. 2019. GauGAN. https://blogs.nvidia.com/blog/2019/03/18/gaugan-photorealistic-landscapes-nvidia-research/
https://nvlabs.github.io/SPADE/
[12] David Bau, Jun-Yan Zhu, Hendrik Strobelt, Bolei Zhou, Joshua B. Tenenbaum, William T. Freeman, Antonio Torralba. GANpaint. 2019. https://gandissect.csail.mit.edu/
[13] Chris Garcia. 2016. Harold Cohen and AARON—A 40-Year Collaboration.https://www.computerhistory.org/atchm/harold-cohen-and-aaron-a-40-year-collaboration/
[14] Algorithmic art. https://en.wikipedia.org/wiki/Algorithmic_art
[15] Generative art. https://en.wikipedia.org/wiki/Generative_art
[16] 維也納技術大學(TU WIEN)的繞線畫(string art)機器人. 2018. https://www.cg.tuwien.ac.at/research/publications/2018/Birsak2018-SA/
[17] Lizzie Plaugic. 2017. Musician Taryn Southern on composing her new album entirely with AI. https://www.theverge.com/2017/8/27/16197196/taryn-southern-album-artificial-intelligence-interview
[18] Ramón López de Mántaras. 2017. Artificial Intelligence and the Arts: Toward Computational Creativity. https://www.bbvaopenmind.com/en/articles/artificial-intelligence-and-the-arts-toward-computational-creativity/
[19] 音樂AI IAMUS. https://en.wikipedia.org/wiki/Iamus_(computer)
[20] Gary M. Rader. 1974. A method for composing simple traditional music by computer.https://dl.acm.org/citation.cfm?id=361200
[21] Marvin Minsky. 1981. Music, Mind, and Meaning. Computer Music Journal, Fall 1981, Vol. 5, Number 3. https://web.media.mit.edu/~minsky/papers/MusicMindMeaning.html
[22] Christopher Fray. 1984. Flavors Band: A Language for Specifying Musical Style. Computer Music Journal. Vol. 8, No. 4 (Winter, 1984), pp. 20-34. https://www.jstor.org/stable/3679773
[23] David Cope的“音樂智慧實驗(Experiments in Musical Intelligence)”.https://artsites.ucsc.edu/faculty/cope/experiments.htm
[24] Josep Lluís Arcos. 1997. A Case-Based Reasoning system for generating expressive performances. https://www.iiia.csic.es/Projects/music/Saxex.html
[25] Maarten Grachten, Josep Llu´ıs Arcos, and Ramon L´opez de M´antaras. 2004. TempoExpress, a CBR Approach to Musical Tempo Transformations.https://www.iiia.csic.es/~mantaras/TempoExpress.pdf. https://www.iiia.csic.es/Projects/music/TempoExpress.html.
[26] 巴迪·霍利(Buddy Holly). https://zh.wikipedia.org/wiki/%E5%B7%B4%E8%BF%AA%C2%B7%E9%9C%8D%E5%88%A9