AI

黑栈、算法与AIGC:行星智能时代的电影本体论

韩晓强-_20241031121226.png

韩晓强
西南政法大学新闻传播学院副教授,电影学博士

摘  要:AI大模型的迅速发展让电影生产面临前所未有的转型。电影第一次面临其“基础设施”的解构和重建。从“制作”到“生成”的变革也让我们对作为新基础设施的AI大模型有更深刻的理解,即它不是一个“黑箱”,而是一个“黑栈”。就此而言,本杰明·布拉顿的“堆栈”思想可以在“行星计算”的语境下提供一条探索当代AI大模型及其算法的有效路径。在人工智能或将接管电影生产的AIGC时代,人类需要与AI建立起一种肯定性的生命政治关系。

关键词:人工智能电影 黑栈 行星计算 AIGC 碎片美学

我们的机器越来越聪明,而我们却越来越愚蠢。但事情未必要发展成这样。两者都可以变得更加智能。另一种未来主义也是可能的。

——本杰明·布拉顿

在科幻名作《机器人大师》中,斯塔尼斯瓦夫·莱姆以未来学的视野勾勒出一个“电子诗人”的寓言故事,它依靠宇宙级别的计算能力吞噬着历史和文化,在创作上几近无所不能,以一己之力取代了诗人这个群体。

莱姆曾预言的一切,都在接近60年后以现实的版本到来。电子诗人不就是ChatGPT另一种称谓吗?那个巨型航母式的、产生惊人耗能的引擎不就是它的本原样貌吗?目前各行业的忧心忡忡不正是当代从业者对AI替代自身的生存恐惧吗?在OpenAI Sora、Google Veo等视频大模型出现后,电子诗人不也可以置换成“电子电影人”吗?如果它能够使用成千上万个艺名,按照发行方、院线、流媒体平台的要求迎合观众的口味,迅速“创造”出任何主题、任何风格以及任何雅俗程度的电影长片。那么这种全然省略以往的剧本创作、置景、拍摄、剪辑等步骤,几近于“无中生有”的生成式电影(generative film),又会是一种怎样的“电影”?这种电影目前尚未真正到来,但按技术演进的速度已然相距不远。届时,我们应该如何面对这类“电影”?或者说,AI生成电影的来临会怎样革新这门艺术自身的本体论?

微信截图_20241030231337.png

目前对最新AI大模型的称谓,通常还有“生成式媒介”(generative media)、“AI媒介”(AI media)、“生成式AI”(generative AI)、“合成式媒介”(synthetic media)等不同的说法。它们基本上都是可以互换的术语,指的是利用深度神经网络创建新媒体对象的过程,如图像、动画、视频、文本、音乐、3D模型和场景以及其他类型的作品。就此来说,生成式AI艺术在本体论上全然有别于之前的计算机艺术,我们不得不承认AIGC革命即便在整个艺术史中,都是一项不亚于19世纪摄影术或16世纪透视法的革命性发明,以至于完全可以按照麦克卢汉的方式大声疾呼“模型即讯息”(the modelis the message),但我们究竟应该如何从本体论上来描述它?

在回应这个问题之前,我们要回到的或许不是巴赞《摄影影像的本体论》中的讨论,而是电影的基础设施(infrastructure)。这个术语在媒介研究中的地位奠基自美国媒介理论家约翰·杜海姆·彼得斯(John Durham Peters),但其真正源头可以追溯到刘易斯·芒福德。在《机器神话》一书中,芒福德指出若将王权时代的全部部件,即政治、经济、军事、官僚制度、皇权等统统囊括其中时,就成就了一个“巨机器”(Megamachine)。巨机器的出现是建设金字塔、万里长城和哥特式大教堂的前提。以此类比,电影的基础设施可以被视为好莱坞或者类似的全球电影工业体系,涵盖了从器械制造、建筑、创作(编剧、导演、摄影、服装、道具、照明、录音、特效、剪辑)、发行、放映等各个环节,是各种相关物料、物流和人力活动的综合体。

尽管20世纪末的数字化被视为一种本体论上的断裂,但从基础设施的角度来说,电影并没有根本上的形态变化,它仅仅是改变了其信息的载体和传播形式,始终还是一个坐拥多元化人力物力的创作行业。唯有从“制作”(making)到“生成”(generating)的转型中,电影的基础设施才面临绝对的更迭——就像莱姆小说中的诗歌行业希望签发禁令一样,最害怕这类电影智能生成器的,无疑是以电影制作为核心的好莱坞。他们惧怕这种生成器的程度,会远远超过他们曾经惧怕的电影流媒体平台。诚然,电影的AI大模型也会是一个平台,但它仅仅是奈飞(Netflix)、葫芦网(Hulu)、亚马逊优选视频(Amazon Prime Video)、迪士尼+(Disney+)这样的应用平台吗?

回答这一切的关键,或许还要回到莱姆小说中那个“巨型航母式的、产生惊人耗能的引擎”,它庞大的身躯和最终的归属意味着它是一个行星级的造物,即一个“堆栈”(Stack)。所有的堆栈都是平台,但并非所有平台都是堆栈。按照该术语缔造者、美国哲学家本杰明·布拉顿(Benjamin H. Bratton)的说法,堆栈是一个行星规模的基础设施,是一个关联各种行星计算(planetary computation,涵盖了智能电网、云计算、移动和城市级软件、通用寻址系统、普适计算和机器人技术)的巨大且连贯的整体。正如布拉顿在《堆栈:软件与主权》一书中所说:

它们意外地形成了一个名为“堆栈”的巨型结构(mega structure),这不仅是一种行星规模(planetary-scale)的计算系统,也是我们如何将世界划分为主权空间的新架构。更具体地说,该模型借鉴了软件协议栈的多层结构,其中网络技术在模块化和相互依存的垂直秩序中运行。该模型将堆栈的逻辑寓意为系统的一般原理,并用它来描述政治地理被细分的几何形状,以及占据这些空间的技术的总体形状。堆栈模型是全球性的,但并非一成不变。恰恰相反,它本质上是模块化的,因此这个巨型结构也是一个平台,甚至是一个界面,可以用我们想要的堆栈(或者我们最不想要的堆栈)来重新设计和替换我们现有的堆栈。

布拉顿将堆栈自下而上区分为6个层级:地球层、云层、城市层、地址层、界面层、用户层。这个垂直媒介化的堆栈才是今天生成式AI大模型的“真身”。换句话说,AI大模型的实质绝非Sora和Veo这类的AI视频应用(它们仅仅是一个光滑的界面),而是涵盖其平台——OpenAI和谷歌等新地缘政治性的“半球堆栈”(Hemispherical Stacks)在内的新型堆栈。如果要将这类新型堆栈和那些“我们曾经拥有”的堆栈区别开来,我们不妨参照布拉顿本人的逻辑,将AI大模型视为那个在2016年书写本书时“即将到来”且目前“已然到来”的堆栈,即“黑栈”(Black Stack)。诚如布拉顿指出:黑栈既非无政府主义的堆栈,也非死亡金属堆栈,它不是一种完全不透明的堆栈,而更似是一种计算性的“来临中的总体性”(totality-to-come)。在此,布拉顿的计划显然是以这一行星计算总体来取代阿甘本的那个“来临中的共同体”,毕竟黑栈远没有那样的乌托邦式色彩,而是由其所非之物、其架构中的空白区以及其不可回避的恐怖性共同构成。因此,定义此平台的原则,就变成了其创造偶然的能力以及相应的战略,让起初看起来糟糕的(甚至邪恶的)选择最终都能通向最好的出路。

这番近十年前的预测性表述几乎完全击中了今天AI大模型的事实:它并非一个单纯的“黑箱”,而是一个名副其实的“黑栈”。它是一个更立体的行星级基础设施,而非被简化的技术用具。黑栈之所以是黑色的,并非因为我们看不到它的机制,而是因为“我们在其中看不见自己的倒影(reflection)”。布拉顿说的没错,当计算自身转变为我们无从了解的下一代元机器(metamachine),堆栈就演化成了黑栈。美国学者兼艺术家凯特·克劳福德(Kate Crawford)是果断接受堆栈模型的AI研究者之一。她在《AI地图集:人工智能时代的政治、权力与行星成本》中提到了关键两点:(1)AI必然涉及算法、数据、云架构这些概念,但若没有构成计算机核心元件的矿产和资源,这些概念都无法发挥作用,因此这个网络计算架构世界的内核是锂为代表的行星矿(planetary mine)。(2)驱动人工智能系统所需要的堆栈远远超过数据建模、硬件、服务器和网络的多层技术堆栈(technical stack)。AI面向的是一个“全栈供应链”(full-stack supply chain),这涉及资本、劳动力和行星资源,且每一方面的需求量都无比巨大。

克劳福德认同行星计算这一基础逻辑并视其为AI运转的基础,尽管她作为人类世艺术家及女性主义者对AI系统的自动性及其潜在的意识形态持批判性态度,甚至抛出AI“既不人工,也不智能”的结论,但这并不意味着对AI的全盘否定,而是说我们应该从更完整的视角(堆栈或黑栈)来认识它,而非将其化约为一个单纯的技术问题。尽管这个黑栈生成电影的能力仅仅是其整体功能中极小乃至微不足道的一部分,但就其机制而言仍然是一种行星式的动员,它与常规的电影动员(哪怕目前最昂贵的电影制作)相比属于全然不同的规模。这绝非机器人拍摄电影的那类自动化,因为这里没有出现类似的物理事件,而是说如导演、拍摄、剪辑这些既往的本体论活动都在AI的算法语言中被全然内化了。这不仅是一种“无拍摄的电影”,也是“无电影术的电影”(film without cinematography),因而让电影(cinema)这一彰显运动(无论是场面调度中的人物运动还是摄影机运动)的术语近乎消解,成为一个单纯装饰性的提示语。事实上,如今人们已然在文生图像和文生视频中使用“电影化的”(cinematic)这一提示作为风格上的补充,它已然成为一种可以明确识别和建构的“系统风格”。

我们也可以将这类黑栈的工作原理视为对电影诸流程的压缩。从原理上来说,它涉及提取、分类、筛选、插值运算、预测、关联和输出。这意味着只要有足够的时间、材料和能量,任何可以还原为数据和符号化表达的问题都可以经由一台经过设计的机器来模拟、预测和生成。AI大模型本身就存在于数十亿台小图灵机组成的庞大网络中,它是一台极度饥渴的机器,既吞噬着地球的化学物质,同时也吸收着各种各样的文化数据(对电影来说,除了120多年电影史上的数百万部影片和电视剧集之外,或许还应该纳入历史上的电影理论、电影批评,更不用说各大电影网站的评分)。它是行星规模计算催生的“算法物种”(algorithmic species),自此我们的文化便建立于这样的逻辑之上:我们如何训练它们以及我们如何被它们训练。

围绕生成式AI和电影的关系,我们需要着重指出三点:第一,AI大模型是模拟性的,从Sora自视为“世界模拟器”(simulators of the physical world)的狂妄表述中,我们不难看到它试图模拟的不再是某物或者个别的艺术,而是试图模拟总体的世界。这就是目前一些学者观察到的现象,即AIGC一定会通向AIGW(AI生成世界)。这种模拟—生成拥有前所未见的深度和广度,它是行星式的,就如埃姆斯夫妇的《十的次方》(Powers of Ten,1977)中展现的那样,可以跨越向下10-16米到向上1024米的整个行星范围,其原型就是一个伸缩性的堆栈。但它的前提也是一种暴力的压缩,其压缩程度和尺度远超过苹果产品的文化压缩(类似2024年iPad广告《Crush》所展示的那样)。换句话说,作为模拟器的AI大模型能够自动地将多个异质性时空纳入同一个图景当中。

微信截图_20241030231427.png

2024年iPad广告《Crush》

第二,AI大模型是多模态的,这是因为堆栈系统共享相同的训练材料,将一切可以化作数据之物建构成可以相互转化和跨越的连续体。人工通用智能(AGI)的前提就是AI媒介作为一种跨越文字、图像、声音、影像的通用媒介。就此来说,其工作不限于模拟,而更多是一种跨媒介转译(translation)。这类转译的机制在于,通过一种媒介的输入来激活整个堆栈,同时通过分布于云层的人工神经网络来预测另一种媒介形式的输出,并最终映射到其他媒介的输出。堆栈系统保证了大模型能够在电影和文字、图像、动画、3D模型、音乐之间进行自由转译。在以往,这种转译只能依靠人工来完成,且需要专业技能和相应的媒介知识。如今,这类转译能够以大规模、短时间的方式自动完成。尽管目前的文生视频、图生视频和当下电影人将小说改编成电影的实际活动还不是一回事,也尚未达到类似的效果,但它终将不是问题。

第三,AI大模型让当下及未来的电影创作越来越接近于一种“设计学”。正如布拉顿所言,我们没必要复兴自然,而是需要重新思考“人工性”的概念,人工的并不是“伪造的”,而是“设计的”。堆栈本身就是为了不断重新设计而生,就像一艘“忒修斯之船”。尽管布拉顿的设计学目标指向的是智慧城市和地球工程,但在电影创作中我们不难发现类似的迹象。这种迹象甚至从After Effect等设计软件全面流行的时候就已然开始了,马诺维奇曾经提及的“数据库电影”也在很大程度上基于设计性的考量。但只有到了生成式AI的时代,我们才能谈论这种广义的电影设计,这不仅在于从数据科学统计方面穷尽其形式、风格和美学潜能,也在于找到最好的建构组合方式。这一切都可以变成自动化的、智能的,也就是说电影能够做到自我设计、自我迭代、自我进化。

微信截图_20241030231512.png

布拉顿堆栈理论的另一个推论是:人工智能并非康德式的智能,而是“我们还没有词语来描述的智能”.这或许可以对应著名的“泰斯勒定理”(Tesler’s theorem),即人工智能总是尚待完成的事物。理解该问题的一条重要线索来自哲学家维特根斯坦,在1939年开设于剑桥的《数学基础》课堂上,他与前来听课的人工智能先驱阿兰·图灵进行了激烈且不乏启发的辩论。两人之间基本的分歧在于,图灵坚持一种机械性的思维,而维特根斯坦则声称若要理解智能的问题,就首先要澄清我们的语言和概念习惯。他后来在《哲学研究》中表达了以下观点:

机器会思想吗?——它会疼吗?——该把人体叫做这样的一台机器吗?它可是极接近于这样一台机器啊。但机器当然不会思想!——这是一个经验命题?不是。只有说到人,以及和人相似的东西,我们才说他思想。我们还这样说布娃娃,当然还有精灵。把“思想”一词当做工具来看待它。

两人之间的争论显然可以延续到今天的人工智能,图灵或许会认为,人工智能需要严格的、数学的、具备可解释性的形式化理论作为基础;而维特根斯坦则会认为,只要你学会使用它、调试它,如同生命一般感受与它的互动,你就会创造它。目前各种AI大模型的成功,似乎都验证了维特根斯坦的远见,但相应而来的问题是,如果电影创作这个过往专业性极强的艺术活动,变成了人人可以掌握的技术能力,那么我们能否接受它可能导致的代价,即斯蒂格勒所说的“审美的无产阶级化”或者“深度创造性的消失”。毕竟,当器具(摄影机、画笔、乐器)都全然不在的情况下,我们怎样期待未来深刻的艺术创造呢?

但反过来说,如果人工智能的能力不断扩展,能够成为一种“文化人工智能”(culture AI)或者“艺术智能”(Artistic Intelligence),能够生成更多、更长的原创内容,能够更好地理解和关联上下文语境,那么这一点也可能会是乐观的,即便像侯世达所恐惧的那类后果也只是暂时的。尽管我们不能简单断言AI未来创作的电影能够同现有最优秀的电影相媲美,但只要AI模型能探索电影的无数变体并呈现更多的可能,就很可能是这一行业的福音,但这属于创造力(creativity)的体现吗?还是说,这并不是一个经验性的问题,而是和我们赋予“创造力”以及“智能”时的预设有关?

让我们首先回到创造力一词,美国认知科学家玛格丽特·博登(Margaret Boden)区分了三种创造力:探索型创造力(exploratory creativity)、组合型创造力(combinational creativity)以及变革型创造力(transformational creativity)。其中,探索型创造力指的是探索已知事物的边界,在保持规则约束的同时扩展其极限,其中最具标志性的就是数学——由于人类97%的创造行为都属于探索型创造行为,运算和破解能力远远赶不上计算机,因此它算不上真正意义的创造。博登提及的第二种创造力,即组合型创造力,在于将两种完全不同的结构或理念结合起来,这是艺术家的惯用手法,以某些领域的特定规则为其他领域创建出新的框架,但目前的一些艺术创作表明,组合型的创造力也可以完美适用于人工智能的世界。譬如,AI可以随意组接不同流派、不同时代或不同风格导演的作品,来进行创造性重组,生成类似拼贴艺术的电影类型。此外,当机器学习系统错误地(或不合常规地)将一个对象进行分类的时候,也可能会无意间发现两个事物之间的潜在关联。

第三种创造力,即变革型创造力,需要全然打破规则,确立一种新的秩序和形式。乍看之下,机器和人工智能很难实现这样的任务,而在人类艺术界,这样的创造可以归于杜尚、毕加索、博伊斯以及戈达尔。在人工智能的历史中,变革型创造力方面的突破可以追溯到AlphaGo击败李世石时下出的第二局第37手,这步棋意味着颠覆了百年来建立起的行棋观念。对人工智能的一种典型的认知上的自负在于:我们通过对自身智能的体验来定义了“智能”,而非将智能视为任何具有如此秩序之物质的涌现能力。就此来说,这种创造力的本质,绝非人类独有,而是可以经由超级计算来识别和发现。通过算法创建一个“元规则”,指导机器改变路线,最终产生“非理性”行为,也是机器学习非常擅长的。其中比较有标志性的作品就是2016年的《下一个伦勃朗》(The Next Rembrandt)。该项目通过分析和提取伦勃朗画作中数百张人脸的特征,然后利用这些特征生成具有伦勃朗风格的新图像。

微信截图_20241030231621.png

在《共情的屏幕》一书中,维托里奥·加莱塞(Vittorio Gallese)和米歇尔·圭拉(Michele Guerra)借助于神经科学的研究方法证明了诸如正反打轴线等规则的建立可能只是一种“意外”,这也意味着目前的电影语言很可能只是多种潜在范式中的一种。这些工作都在呼吁我们在艺术场域中更新图灵测试,或者采用洛芙莱斯测试(Ada Lovelace Test)。就此而言,AI所揭示的,很可能是我们目前仅仅触碰到了电影艺术的“表皮”,但在人类的思辨领域,电影语言和电影理论却看似开发殆尽,几无新物——这很可能只是福柯所说的“人类学幻相”(anthropological illusion)。事实上,正如机器视觉可以在诸如X光、热感、卫星图像等方面超越人类,AI在艺术领域也很可能成为电影的哈勃望远镜,成为一种探索比以往更深、更远、更广领域的艺术智能。

AI可以发现新的电影语言,建立全新的电影美学体系吗?AI电影大模型可以在艺术上媲美爱森斯坦、希区柯克或者戈达尔吗?如果在2022年之前,人们对此尚有诸多不信任,那么在2022年之后,更多人相信这仅仅是原则上的时间问题。其艺术上的转折点便是土耳其裔美国艺术家雷菲克·阿纳多尔(Refik Anadol)2022年创作的《无监督》(Unsupervised),通过使用纽约现代艺术博物馆的数万件艺术作品作为训练集,AI大模型生成了真正意义上的新文化艺术作品,具有前所未见的内容、美学和风格。正如马诺维奇所说:

看着这件作品,我想到了塔可夫斯基的《飞向太空》(1972)中的索拉里斯星。依靠着围绕它运转的空间站中人类居民的记忆,索拉里斯星合成了类似人类的“客人”。在整部影片中,这颗行星的表面变幻无常,时而呈现出具体的图像,在影片结束时又化身岛屿。与《飞向太空》类似,《无监督》所生成的东西既熟悉无比,又与MoMA收藏品的诸多创作者的观念迥异。或许,这是人类与他们所设计的计算机系统之间即将出现的新意识形态的先行一瞥,也是未来的文化语言,而现在的我们仅仅是在学习如何读懂这种语言。

在马诺维奇眼里,《无监督》既非从零开始的创作,也非简单地捕捉现实,更非文本征用和媒介拼贴,而是经由大量媒介艺术作品的档案进行深层建构,也就是从中提取模式(patterns)和关系(relationships),这近似于一种“人工柏拉图主义”(Artificial Platonism)。然而下一步更为关键:AI会利用所学到的一切知识生成变化无穷的视觉表面,以不可预知的方式在这些艺术品及其图案之间进行穿插组合(interpolates)。由此,作品会在2D和3D之间往复震荡,在纯粹抽象和特定作品的可识别碎片之间往复震荡,在轻慢的运动和戏剧性的爆炸之间往复震荡。

目前“无监督”的神经网络可以不受预先制定的准则限制,对庞大的数据集进行筛选,其原理就是“白板学习”(blank-slate learning)。长期研究人工智能的数学家马库斯·杜·索伊托(Marcus Du Sautoy)认为这种学习算法是通用的,可以适用于任何领域,自然也包括艺术。这种自由度使得替代式的分类系统得以出现,甚至比人类设计的分类系统更为先进或更为复杂。它们自动通过算法数据处理来分析电影的语法、调度、品味和风格,能够超越人们所熟悉的有限范围。它可以分析成千上万种类型,提高分析的粒度,这不但让其分类变得更为精确,也变得更为流动和连续,这反映了从传统离散分类向更加动态和更为广阔的框架的转变。就此而言,让生成式AI打破电影语言和语法的“元模式”才是更彻底的做法。如此我们就或许应该接纳马诺维奇定义AI艺术的第三种方案:AI艺术是人类由于身体、大脑和其他制约带来的局限性而无法创造的一种艺术。

上述对算法智能与创造力的思考,与布拉顿试图修正我们对算法和自动化之通行理解的原则如出一辙。在他看来,将算法视为类人模式,将人工物和合成物全然混淆,都是这个时代的典型误解,我们必须将生成式算法及其智能重新定义为人类智能与人工创造的非人智能组合而成的合成智能(synthetic intelligence),该智能体能够创造出我们事先未曾想到或从未打算创造的东西,其非人部分也能使其更具创造力。布拉顿甚至建议把它们想象成多米诺骨牌,“它们的排列深入事物的核心,它们的级联能动性超出了任何一次引发多米诺骨牌效应的初始意图……这些系统是经过编排的,但它们也会随着每次迭代而进化”.从合成智能及其演化论的角度,我们似乎可以更多肯定AI大模型的创造性未来,因为它完全有能力将一种暴力性的世界压缩转化为生机性的艺术孕育。

微信截图_20241030231641.png

我们不免来到一个关键问题:失去了cine-这个前缀的历史要义,生成式电影的本体论应该如何描述?考虑到布拉顿建构堆栈模型的主要目的是应对平台资本主义时代的政治哲学以及未来的“地球改造”(Terraforming),更有针对性的答案来自和布拉顿领域相近且有过颇多合作的列夫·马诺维奇。作为痴迷新技术的学者,马诺维奇在2018年就出版了《人工智能美学》一书,由于时代限制,他在这本书当中并未提出真正有益的观点。不过在随后更新的研究项目及在线图书《人工智能美学:生成式AI、艺术与视觉媒介》(目前尚未完结)中,我们不难发现马诺维奇作为一位AI艺术的长期观察者兼实践创作者应对最新问题时所应有的灵活洞见。

在该书最近更新的第七章中,马诺维奇就上述问题提出了一个值得参考的答案:如今的本体之物就是AI在“压缩”与“生成”之间制造的碎片(fragments)。该理念显然是从W.J.T.米切尔的“分离”(separate)与“重组”(reassemble)理论中延伸出来的,也就意味着数字化的逻辑在AIGC时代仍然有其合理的延续性。AI和人类意识一样,都是通过“将世界压缩”来认识这个世界,其中最典型的就是分类学。但AI的压缩和人类的压缩不但有着规模上的不同,也存在倾向上的差异:人类在压缩中会保留诸多具体而独特的细节,在一般模式中加入特殊、罕见和意想不到的元素,以至于主次和疏密度悬殊;AI在压缩中则会剔除异常值和许多独特的细节,只选择出现频率最高的的关联、特征和结构。

我们当然不能将这种碎片等同于古代文明的物理残片,因为如今的碎片是生成式AI的典型创造,也是其训练模式的根本产物。每一次模型训练当中,AI都需要从数以万计乃至数百万计的作品中提取模式,并将其分布在数以万亿计的连接当中。马诺维奇对这一过程展开了近乎诗意的描述:“在这样的训练中,图像的数字物质被进一步虚拟化、蒸发、弥散,但最终仍旧以某种方式保留下来,这就是图像中生成的‘碎片’,它们就像某种气息(scents)、察觉不到的微风以及海水在沙滩上留下的痕迹。”应该说,这些碎片不只是生成式电影的本体,也是所有生成性视觉艺术的共同本体,因为它们废除了任何媒介的特权。它们在根本上是“碎片之碎片”(fragments of fragments),是形式破碎后的沉积物(deposits),比之废墟的尘土颗粒更为支离破碎。它们既非香农信息理论中的“噪声”——事实上这些碎片既不是信号,也不是噪声——而是人工智能美学(即分布式知识和分布式视觉)的本体论产物。从堆栈的角度来说,它们亦是事物的抽象颗粒性(abstracted granularity)和它们膜的湿润性(wetness)之间不可化约的残余。

这意味着在机器学习过程中将文化艺术品分解成碎片(如图像像素和部分文字),然后分阶段处理这些碎片,最终使AI大模型能够获取知识,进而生成文本、图像、音乐、空间和代码。简而言之,通过将人类历史文化分解成碎片,我们得到了新的“生成文化”(generative culture)。AI这个“精粹机器”(quintessence machines)可以沿着任何一条随机线索产生无穷无尽的瑰丽新世界,这在最近两年的诸多大模型中得到了验证。因此,与其纠结于AI不能做什么,不如假定它能做的越来越多、越来越好且越来越全面。其根本的前提是AI能够在互联网这个巨大的无墙博物馆中进行无限遨游式学习。

我们能够确认的一点是:AI能够通过神经网络对数以百万计的影片、剧本、剧照、电影评论(和评分)进行系统学习并找到相应的输出策略。这意味着在输出之前,一个电影大模型会在其神经网络中进行数千万次到上亿次的计算,这是人类电影人无法做到的。由此,将AI作为一种前所未有的高效乃至创造性的工具,来补充人类思维,实现“人机共创”,似乎是电影创作之未来的美好愿景,但事实果真是这样吗?

我们不妨猜测未来可能的几种情况。

第一种情况是:由于AI大模型可以更好地托管电影生产,因此电影人会转型为大模型的设计师和训练师,以更好地提升其性能和美学标准,同时将“制作”电影的权限让渡于普通观众,以实现创作上的民主。

第二种情况是:由于AI具有自己的创作和审美意识,因此电影的创作被逐渐纳入一种非人的范式,AI可以创作和欣赏自己的电影,而且其内容、风格、旨趣越来越与人类无关。

无论如何,“人机共创”都是一个单纯的幻想,它仅仅属于AIGC的时代之前,即数据科学和软件设计能够辅助创作的时代,也就是After Effect等软件流行的时代。然而在AIGC以及未来的人工通用智能(AGI)时代,接续这类幻想无疑是一种笑谈。马诺维奇对此的态度是:考虑到我们肉身的局限性,我们无法与超人竞争,也就是无法与网络、搜索引擎、庞大的数据库、机器学习算法和生成式人工智能竞争。因此,“人类艺术家以AI工具创造艺术”是个毫无意义的说法,毕竟,你想和神合作吗?一个肉体凡胎之人能够与阿波罗、雅典娜、赫菲斯托斯、赫尔墨斯及宙斯合作吗?42布拉顿对此的表述更为极端,即真正的噩梦比之“大机器想要杀死你”要恐怖得多,它可能压根就无视你,或者根本不把你作为一件离散的事物来认知。借用计算机科学家埃利泽·尤德考斯基(Eliezer Yudkowsky)的说法:“AI并不恨你,也不爱你,在它看来,你只不过是由一些原子做成的,而它能用这些原子来干点别的什么事。”

黑栈不可或缺的就是这种哥白尼式的创伤,将我们从人类世的设计者转变为后人类世(或AI世)到来时的配角。那么,在AI统领一切(AI take command)的时代,人类还能做些什么呢?如果创造力和知识都归AI所有,人类还剩下些什么?如果AI托管了电影生产,人类电影人又该何去何从呢?这似乎又回到了莱姆小说中电子诗人的危机难题。尽管业界会有这样一种积极的看法,即AI最终会将人类从机械且枯燥的工作劳动中解放出来,只从事游戏和艺术。这方面最杰出的范本就是康斯坦特的情境主义设计项目《新巴比伦》(New Babylon)。但是,如果AI对文化生产的自动化继续下去,最终创造及操玩这些游戏和艺术的将会是AI,而不是人类。

抛弃人类中心主义,加入所谓的“万物议会”(the parliament of things),拥抱后人类和非人类的时代,都是当代理论反复强调的说辞。但在艺术中具体怎么做,人该如何自处,又是个相当经验性的问题,但在马诺维奇看来,这并非无解难题:人类完全可以让AI托管可能托管的部分,但人也有人的用处,这个问题涉及人相较于AI的有限性。这既是人类的缺陷,也是人类的优势,因为人的艺术和美学创造恰恰是始于“局限”(limits)。任何以此来否定人的观念,都走向了人类学幻相的反面,即“控制论幻相”或者“AI幻相”。

换句话说,人类与人工智能既需要彼此分工,又需要彼此竞争。这意味着人类可以将那些无限的事物交托于人工智能,转而去培养自己的局限性吗?马诺维奇之所以捍卫这样的观点,亦是考虑到艺术创作本身就是一种极其限定性的工作,这些限定条件不但是既有的,更是自己有意制造的,生成式AI只不过让原本的限定条件变得更为苛刻而已。在题为“给青年艺术家的信”的段落中,马诺维奇指出:与其在广阔的艺术地面上寻找无穷无尽的可能性,不如集中精力,尽可能深入一个特定点,这就是“像莫兰迪一样思考”,而非“像毕加索一样思考”。就此而言,无论电影人还是其他艺术家,都需要将一种地形学转化为一种地质学,在已然创造的一切和有可能创造的一切的广阔地表上开一个小洞,然后持续挖掘。即便挖掘了太多错误的路径,即便一次又一次地迷失方向,但这都是接近艺术真理的过程。

这与其说是艺术家开采的矿井,不如说是一个狭窄且深邃的生存孔洞,它必须狭窄到“能够穿过针孔,窄到连AI都无法完全达到”.以此实现同AI艺术的错位乃至“正交”。作为一个隐喻性的忠告,马诺维奇思考的是人类艺术究竟如何行事,才能在AIGC的时代不至于完全贬值,他并未简单地将底线放在人的“情感”“道德”和“爱”这些方面,毕竟,只要接纳AI作为智能的事实,这些所谓的“人类专属特质”都敌不过技术发展的未来性。在他看来,无论出于同AI良性竞争的考量,还是出于对人类从事艺术创作的历史信念,艺术家和电影人都应该“成为鼹鼠”,在这颗行星上打造出自己特有的洞穴。但洞穴未必意味着安全,因为AI总会有深度探测和掘地三尺的能力,会在转眼间摧毁这个花费几十年时间打出的地道,这种极限境况势必会给艺术家带来无尽的压迫和焦虑,但也恰恰是人类最终制作出原创性作品的真正动力。

微信截图_20241030231711.png

在AIGC时代,谈论电影及电影的本体,或许显得过于狭隘了。但无论将其作为一种近在咫尺的未来学进行演绎,还是仅仅作为一种可能的思想实验,都并非毫无裨益。沿着前文的论述继续思考,我们可以说马诺维奇的“鼹鼠思维”尽管可以让人类艺术家做到独善其身,但在普遍观念方面没有构成有效的指引,这或许和他作为一位美籍俄裔艺术家始终致力于规避政治和意识形态有关。由此,要超越这种观念,我们还需要一种更加肯定性的生命政治,将鼹鼠思维上升到行星思维。这里可以参照布拉顿的说法,一种肯定的生命政治学不仅关注生命如何出现或变得自由,而且还关注它如何被修复、复制、维持和保存。这就要求在基础设施上继续训练行星规模的计算和建模能力,以补救和纠正一个受伤的物种及其受伤的栖息地。

这会导致“真实的复仇”吗?还是说人工智能可能造就一种名副其实的“行星电影”及“行星艺术”,能够在这种比较行星研究的视野内探索其普遍的潜能,进而成为“地球改造计划”的一部分?布拉顿选择将希望寄托在不断行进的智能人工化以及结合人类、非人类认知的通用智能(即AGI)上,事实上也只有它能够在地球世俗幻灭的基础上构思和建设一种可行的行星性。在已然揭示的行星性和必须形成的行星性之间,人类最重要的使命就是与“非人智能”建立起一种肯定性的生命政治关系,如此,人类世之蚀(the eclipse of Anthropocene)或将成为AI世之始,它或许能开启以合成智能通向行星智能(Planetary Intelligent)的时代。让人工智能成为一种艺术智能,让人类的电影成为一种跨越人和非人的“行星电影”,或许就是AI生成电影的未来任务。


相关文章    更多>>

推荐文章