聚焦人工智能文藝的“算法”
日期:2024-08-07 來(lái)源:中國(guó)社會(huì)科學(xué)網(wǎng)-中國(guó)社會(huì)科學(xué)報(bào)
2024年初,文生視頻模型Sora橫空出世,在ChatGPT基礎(chǔ)上取得了重大突破,推動(dòng)人工智能文藝實(shí)現(xiàn)又一次跨越性發(fā)展。雖然人工智能文藝的算法運(yùn)算所基于的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)或大模型不同,但無(wú)論是卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、擴(kuò)散模型、轉(zhuǎn)換器模型還是不同模型間的組合、進(jìn)化,都宣示了“算法”在人工智能文藝中的核心地位。算法不僅延伸了人類的智能,更拓展了人類的美學(xué)經(jīng)驗(yàn)。在算法全面介入文學(xué)、藝術(shù),驅(qū)動(dòng)單模態(tài)甚至多模態(tài)文本生成、圖像生成、動(dòng)態(tài)影像生成的今天,人工智能文藝研究必然無(wú)法拒斥、回避算法。
算法的位移
人工智能和文藝的結(jié)合從未像今天進(jìn)入大模型階段后這樣緊密和普遍,傳統(tǒng)上利用算法進(jìn)行文藝生產(chǎn)的能力僅僅被少數(shù)先鋒藝術(shù)家掌握。譬如,20世紀(jì)60年代就出現(xiàn)了雷蒙·奎諾(Raymond Queneau)、喬治·佩雷克(Georges Perec)等藝術(shù)家和數(shù)學(xué)家組成的實(shí)驗(yàn)性團(tuán)體“潛在文學(xué)工場(chǎng)”,也被稱作“烏利波”(Oulipo)。該團(tuán)體的理念是通過(guò)數(shù)學(xué)邏輯和約束性創(chuàng)作原則挑戰(zhàn)文學(xué)創(chuàng)作的界限,探索文學(xué)藝術(shù)創(chuàng)造力的邊界,從而挖掘文學(xué)與數(shù)學(xué)、科學(xué)之間的關(guān)系。
雖然藝術(shù)家和藝術(shù)家團(tuán)體開(kāi)辟了算法文藝的先河,然而這種需要掌握復(fù)雜數(shù)學(xué)運(yùn)算邏輯和運(yùn)算技術(shù)的大膽文藝創(chuàng)作,對(duì)于普通人而言極具門(mén)檻,普通人甚至大多數(shù)藝術(shù)家都難以進(jìn)入依靠運(yùn)算進(jìn)行藝術(shù)創(chuàng)新的先鋒領(lǐng)域。直到大模型算法出現(xiàn)的今天,這樣的算法文學(xué)、藝術(shù)創(chuàng)作權(quán)才在技術(shù)和資本的合作推動(dòng)下賦予普通人。尼葛洛龐蒂所謂的“人人都有麥克風(fēng)”在今天發(fā)生了新的形變,幾乎人人都能夠借助人工智能平臺(tái)工具進(jìn)行專業(yè)化的文藝創(chuàng)作。這是算法在文學(xué)藝術(shù)中的首要位移,不亞于攝影術(shù)誕生所帶來(lái)的機(jī)械復(fù)制時(shí)代的藝術(shù)后果。
整體而言,作者、作品、讀者和世界四要素紛紛被大模型算法滲透。作者不僅包括人類作者也包括人工智能這樣的智能類主體,作品由數(shù)據(jù)和算法在人類關(guān)鍵詞的引導(dǎo)下自動(dòng)生成,讀者的趣味受到算法策展的影響,世界也在算法轉(zhuǎn)譯下進(jìn)一步編碼為虛擬真實(shí)世界。四要素被算法滲透,也兩兩之間形成相互作用的循環(huán)。人與算法在關(guān)系、互動(dòng)、相互滲透中塑造了今天人工智能文藝的基本圖景。
進(jìn)一步思考,大模型算法對(duì)四要素以及人工智能文藝圖景的整體變革是在兩個(gè)基點(diǎn)的基礎(chǔ)上形成的。大模型算法一方面帶來(lái)“人機(jī)交互”的進(jìn)化,另一方面實(shí)現(xiàn)了對(duì)“虛擬真實(shí)”的進(jìn)一步拓展。ChatGPT和Sora分別揭示了這兩種底層邏輯。作為Open AI發(fā)布的應(yīng)用,ChatGPT能夠在與人類創(chuàng)作者的多輪對(duì)話中進(jìn)行記憶、聯(lián)想和推理,人機(jī)交互的流暢度和有效性提高了文藝生產(chǎn)效能;而Sora的“模擬世界”能力體現(xiàn)在能夠根據(jù)用戶輸入文本生成高清、連貫的一鏡到底視頻上,顯示了其對(duì)現(xiàn)實(shí)世界的模擬甚至復(fù)制能力,塑造了大模型時(shí)代虛擬真實(shí)的地理學(xué)。
這兩個(gè)基點(diǎn)使大模型文藝相較于前大模型時(shí)代的人工智能文藝實(shí)現(xiàn)了跨越式發(fā)展,這不僅是大模型時(shí)代之前的算法無(wú)法做到的,也是決定人工智能文藝未來(lái)發(fā)展方向的重要立足點(diǎn)。因此,在“人機(jī)交互”和“虛擬真實(shí)”兩個(gè)基點(diǎn)層面算法實(shí)現(xiàn)了第二重位移。
算法對(duì)人本主義的僭越
古希臘哲學(xué)家普羅泰戈拉提出,“人是萬(wàn)物的尺度,是存在者存在的尺度,也是不存在者不存在的尺度”,人能夠憑借邏各斯衡量萬(wàn)物。然而,一定程度上,人工智能文藝中的算法卻僭越了人類作為萬(wàn)物尺度的法則。算法對(duì)人類的僭越不僅體現(xiàn)為算法能夠通過(guò)計(jì)算生產(chǎn)出無(wú)法和人類作品相區(qū)分的作品以替代人類,還體現(xiàn)為算法能夠僭越人類制定的藝術(shù)創(chuàng)作規(guī)則,以其能動(dòng)性、自主性和偶然性實(shí)現(xiàn)對(duì)“潛在空間”的采集和開(kāi)發(fā),超越了人類文藝生產(chǎn)的邊界。
隨著生成對(duì)抗網(wǎng)絡(luò)(GANs)的出現(xiàn),AI在視覺(jué)藝術(shù)創(chuàng)作過(guò)程中的使用顯著加速。GANs通過(guò)一個(gè)生成器和一個(gè)判別器來(lái)進(jìn)行底層“不可見(jiàn)”的計(jì)算工作。生成器通過(guò)學(xué)習(xí)數(shù)據(jù)集的特征盡可能地生成和原數(shù)據(jù)集數(shù)據(jù)分布相同的數(shù)據(jù),接下來(lái)判別器執(zhí)行“判斷”功能,對(duì)生成器生成的數(shù)據(jù)進(jìn)行判斷。如果被證偽,那么生成則是失敗的。如果不能被證偽,判別器就會(huì)對(duì)數(shù)據(jù)“放行”,輸出一個(gè)和原數(shù)據(jù)集相同的數(shù)據(jù)。GANs很快成為人工智能中最重要的研究領(lǐng)域之一,并且出現(xiàn)了基于許多原始架構(gòu)的特定變體,例如CycleGAN、StyleGAN和BigGAN。我們很多時(shí)候無(wú)法分辨、區(qū)分GANs和人類創(chuàng)作的作品?!翱缥锓N”的風(fēng)格傳承使GANs在“模仿”的合格性和有效性上具備了“替代”原作者的可能,人作為萬(wàn)物尺度的崇高性被算法消弭,形成了算法對(duì)人類的第一層僭越。
此外,算法文學(xué)的創(chuàng)作過(guò)程基于算法規(guī)則,而算法規(guī)則是通過(guò)智能算法學(xué)習(xí)人類文學(xué)創(chuàng)作的規(guī)則而來(lái),它本身不創(chuàng)造規(guī)則。但是算法卻能夠僭越人類制定的規(guī)則,在偶然性的維度上拓寬人類的藝術(shù)創(chuàng)作邊界。GANs的創(chuàng)作由于過(guò)于“相似”使藝術(shù)品不具備喚起潛能(arousal potential),因此算法的進(jìn)化方向即在“相像”的基礎(chǔ)上發(fā)生風(fēng)格的“偏移”。創(chuàng)意對(duì)抗網(wǎng)絡(luò)(Can)和GANs相比,調(diào)整之處在于除了對(duì)“是否為藝術(shù)品”進(jìn)行判別,還需要對(duì)“藝術(shù)風(fēng)格分類”進(jìn)行判斷,判別器的兩個(gè)判斷過(guò)程可以指導(dǎo)生成器生成與藝術(shù)品近似的數(shù)據(jù)(art/not art)。以此為基礎(chǔ),算法通過(guò)“畫(huà)風(fēng)融合”(style ambiguity)生成難以判別風(fēng)格類型的畫(huà)風(fēng),從而實(shí)現(xiàn)風(fēng)格的偏移、創(chuàng)新,達(dá)到喚起潛能的作用。以算法的創(chuàng)作沖動(dòng)和創(chuàng)作偶然性脫離人類規(guī)則的束縛,以算法的自主性拓寬藝術(shù)以人為中心劃定的邊界,這是算法對(duì)人類的第二層僭越。
算法的價(jià)值偏差
基于算法在人工智能文藝中的位移和算法對(duì)人本主義的僭越,我們不僅可以確認(rèn)算法在今天人工智能文藝中的重要性,并且可以發(fā)現(xiàn)算法及其文藝創(chuàng)作具有人類“無(wú)法掌控”的一面。這種不可控性不僅發(fā)生在實(shí)踐上,還存在于文藝價(jià)值層面內(nèi)含的算法偏差。
在長(zhǎng)期以來(lái)反對(duì)“技術(shù)決定論”聲音的影響下,“技術(shù)中立性”也似乎成為我們進(jìn)行技術(shù)研究的基礎(chǔ)邏輯前提。遵循此邏輯,算法是純粹由數(shù)學(xué)邏輯驅(qū)動(dòng)的計(jì)算程序,因此具有中立性、客觀性,計(jì)算程序本身無(wú)價(jià)值偏差或文化偏向。但實(shí)際上,由于算法一般歸平臺(tái)所有,受平臺(tái)資本及其意識(shí)形態(tài)影響,或由人類算法工程師、藝術(shù)家設(shè)計(jì),訓(xùn)練算法的數(shù)據(jù)集則由人類某一領(lǐng)域或多個(gè)領(lǐng)域的數(shù)據(jù)痕跡、數(shù)字記憶構(gòu)成,三個(gè)方面層層隱含著人類的價(jià)值偏向。
此外,從技術(shù)角度而言,算法計(jì)算過(guò)程的不透明性和偶然性也有可能導(dǎo)致算法偏差問(wèn)題的發(fā)生。技術(shù)上的偏差與人類偏差相互作用,形成算法偏差。這樣的算法偏差也存在于人工智能文藝中,由于藝術(shù)審美性、游戲性、無(wú)功利性的特質(zhì)進(jìn)一步掩蓋了其內(nèi)在的算法偏差,因此往往更加不易察覺(jué),使欣賞者在算法輸出和算法推動(dòng)作用下全盤(pán)接受和內(nèi)化其偏差。
人工智能文藝的算法研究應(yīng)當(dāng)揭開(kāi)人機(jī)互動(dòng)的復(fù)雜性過(guò)程,在設(shè)計(jì)、過(guò)程、行動(dòng)、結(jié)果多層次上糾正算法偏差,強(qiáng)調(diào)人工智能文藝主體責(zé)任、保障數(shù)據(jù)挖掘的準(zhǔn)確性、提高算法透明性和可解釋性,通過(guò)設(shè)計(jì)和應(yīng)用道德代碼來(lái)規(guī)避算法偏差,確??萍枷蛏?。
綜上,現(xiàn)實(shí)層面算法在人工智能文藝中的位移、算法對(duì)人本主義的僭越、算法的價(jià)值偏差導(dǎo)致了文藝研究聚焦算法的必然。目前,算法仍主要是計(jì)算機(jī)科學(xué)的研究?jī)?nèi)容,“算法黑箱”的存在和技術(shù)門(mén)檻上的障礙,使得文藝研究一定程度上仍然和算法保持距離。近年來(lái),雖然有學(xué)者提出“算法闡釋”(參見(jiàn)曾軍《算法闡釋:人工智能時(shí)代的文論問(wèn)題》)、“算法批評(píng)”(參見(jiàn)秦蘭珺《通向算法合成時(shí)代的文藝評(píng)論》)這種開(kāi)拓性的觀點(diǎn)和方法,然而文藝研究對(duì)算法的研究空間需要進(jìn)一步拓寬。就可行性而言,雖然算法的技術(shù)結(jié)構(gòu)和運(yùn)作過(guò)程無(wú)法為創(chuàng)作者全面掌握,但這并不妨礙我們對(duì)其文藝生產(chǎn)的過(guò)程和后果進(jìn)行研究。秦蘭珺認(rèn)為,算法合成時(shí)代的文藝需要給“人”的因素和“非人”的因素以同等重要的考量,這不僅是為了賦予“物性”以能動(dòng)性,更是為了呈現(xiàn)和批判“物性”中內(nèi)嵌或隱藏的“人性”。聚焦算法,界定算法在人工智能文藝中的位移、審思算法不可控性對(duì)人本主義的僭越、規(guī)避算法價(jià)值偏差帶來(lái)的負(fù)面后果,探索人類與算法如何在關(guān)系性中拓展一種人類—非人類的美學(xué)體驗(yàn),這是與人工智能文藝算法相遇時(shí)無(wú)法回避的追問(wèn)。
(作者系杭州師范大學(xué)文化創(chuàng)意與傳媒學(xué)院講師)