作为后电影的Sora影像

电影艺术首页-20241024100637.png
姜宇辉
华东师范大学政治与国际关系学院教授

摘 要:Sora究竟是艺术创作的利器,还是探索世界的科学模型,这个张力乃至矛盾有待深思。从艺术的角度看,它颇为契合后电影的发展阶段,进而亦呼应着马诺维奇对后媒介的原初界定。而从科学的角度看,它的连贯性原理看似能够缓解后电影的新巴洛克式症结,实际上却更深地陷入其中。由此,从哲学的角度深思双重递归的运动,尤其是第二种递归所蕴含的否定性潜能,不仅能够给出第三种可能,更得以敞开Sora作为弱影像的深刻含义。

关键词:Sora 造世 连贯性 否定 递归 弱影像

谈论Sora,还是有必要先从Open AI官网的两篇介绍文献来入手。然而,细究其中给出的几个基本定义,却已经隐约体会到些许不甚自洽的裂痕。一方面,“Sora是一个基于文本提示而生成现实及想象场景的AI模型”1.若仅从这个界定来看,Sora跟电影创作无疑有着明显而直接的关联。至少从传统和主流的形态来看,电影从根本上说也是源自文字性的脚本,然后再将其转化为“现实及想象”的影像。此外,Sora的生成能力虽然目前仅局限于一分钟的长度,但大多数电影作品也莫不如此,那些动辄两三个小时的大片,最终也无非是由一个个微小的时间片段所构成。如此看来,Sora与电影看似存在着天然的、甚至必然的联系,它完全有理由、也有可能成为电影制作的未来利器。

但另一方面,OpenAI的技术专家们同时又指出,除了用自然语言和文本来引导的提示语(prompt)之外,Sora的生成过程还包含着另外一个本质性的面向,那正是对真实的“物质世界”(physical world)的模仿。仅有巧夺天工的构思或许还只是起点,更为关键的是创制出一个栩栩如生的逼真世界。在《从文本创造视频影像》这篇简短介绍的最后,“理解和模拟真实世界”不仅被视作Sora的旨归,而且更是被提升为AGI的一个重要的未来发展方向。但这里无疑就出现了一个艺术与技术、虚构与科学之间的张力(若不说是冲突)。当我们将Sora理解为人的心灵所驱动的影像和视频创作工具之时,人类主要是作为编剧、导演和艺术家;但若反之将Sora视作理解客观世界的基本途径,那么,人类显然就转而化身为科学家、实验者与技术专家。这双重身份、两种面貌显然并非始终能和谐并存。艺术追寻“美”,科学探索“真”;艺术诉诸人的自由无羁的想象,而科学则更强调脚踏实地的观察、有理有据的计算。固然,科学也每每借用艺术式的直觉,艺术也往往能够令人洞察现实,但二者毕竟还是有着相对清晰边界的分立领域。那么,介于、悬于艺术与科学之间的Sora到底最终倾向于哪一极呢?它主要旨在用影像来释放想象,还是意在最终引导我们回归、深入现实?抑或,它亦有可能在两极之间实现一种平衡乃至融合?如果有,那么此种融合的机制是肯定性的连续,还是否定性的敞开?

微信截图_20241024005518.png

要回答这些根本的追问,显然还是要从Sora的基本原理和方法来开始思考。在《视频影像的创生模型作为世界模拟器(world simulators)》这篇基础的介绍技术背景的文献之中,OpenAI给出了清晰明确的阐释。从根本上说,Sora的最终目的正是模拟实在的物理世界,这一点并无疑义。那么,它到底是如何做到的呢?那正是开篇所强调的“整合式的表征”(unified representation)2.它运用“扩散模型”(diffusion model)对文本、影像、图像进行“转化”(transform)。除却技术细节,这里的关键词正是“整合”。Sora实现的整合大致体现为两个步骤。首先,它得以将语言文本和视频影像这两个看似明显有别的媒介领域整合在一起。这正是因为,Sora得以如此迅速而顺利的诞生,至关重要的技术前提正是在ChatGPT那里达到炉火纯青的大语言模型(LLM)技术。但这也就引发了一个直接的质疑:影像毕竟不同于文字,而影像运动的逻辑也有别于语言生成的语法,那到底何以可能将LLM运用于LVM(Large Vision Model,大视觉模型),甚至在很大程度上将二者“整合”起来?3这就涉及第二个步骤的整合,即在数据这个基本层面上对各种媒介进行整合。确实,文本和影像、语言和视频初看之下彼此有别,但这个差异更多局限于现象的层面,体现于人的不同感知形态而已。从根本上说,它们都是数据,都可以被分解、还原为数据,也都可以,甚至理应按照数据处理的模型和法则来展开运作。所谓扩散模型,无非是对看似混沌模糊的原始“噪音”进行清晰化的处理,将其分解为基本的单元块片(patches),再从中根据模式识别和预测的方法分辨出相对清楚的形象与轮廓。显然,无论处理的对象是语言文字,还是视频影像,甚至是声音和姿势等等,都完全可以采用普适而相似的手法来进行辨识和转化。Sora也许不是一个电影理论的专家,或许也没有深厚的电影史的修养,但它既然深谙“万物皆数据”这个基本原理并能够得心应手地运用,也就当然可以自由穿行于任何一个媒介的领域而毫无滞碍。不妨说,Sora揭示的并非只是视频影像这一特殊领域的规律(正如ChatGPT揭示的并非只是自然语言的模型),而更是贯穿于万事万物背后的根本运作法则。

那么,这是否意味着Sora就在很大程度上远远领先于,甚至彻底挣脱了电影这个特殊的艺术与产业门类的限制呢?对此当然可以有两种根本的、截然相悖的选择。要么,可以将它视作电影的否定、电影史的终结。正如摄影超越绘画,电影又超越摄影,也许Sora也注定将超越和取代电影,成为下一代的、全新的图像和影像的创生范式。要么,亦不妨将其视作电影的延续,即电影在生成式AI的时代的一个全新形态。简言之,Sora不是“非电影”(non-cinema),而更是“后电影”(post-cinema),不是电影之死,而是电影发展的下一个新阶段。4在本文之中,我们更倾向于后一种立场。原因有二。

首先,“造世”(worldbuilding)绝非Sora的原创,其实早已是当代主流电影的一个相当明显的趋势。借用阿兰·布瓦拉(Alain Boillat)的研究,我们不妨将电影的晚近发展的一个根本动向概括为从“叙事”到“造世”5.固然,在传统的电影创作之中,世界也是一个基本的要素,但却往往只是退居边缘和背景,而进入数字时代之后,凭借数字影像技术强大的生成力,造世愈发成为电影的典型手法乃至终极诉求。对于如今的观众,更为爽快而沉迷的电影体验,似乎早已不只是跟随着时间线索去品味一个完整的、有头有尾的故事,而更是在那一个个逼真的、美轮美奂而又极尽复杂的数字宇宙中沉浸与漫游。

但多少令人感觉意外乃至遗憾的是,虽然布瓦拉在全书细致入微地描述了各种造世的手法,但他的笔下所展现的那一个个形态各异的影像世界(“遥远的世界”“超自然的世界”“平行的世界”等等,不一而足),大多仅局限于现象的层次,而全然未触及本体。也即,他所谓的世界充其量只是观众在屏幕上看到的影像,而尚未深入数字和数据这个根本而基础的层面。屏幕上的“世界”只是造世的结果和效应,而数据的模式和处理才是电影造世得以可能的根本机制和动力。由此就涉及将Sora和后电影直接连接在一起的第二重原因。对此,马诺维奇在出版于世纪之交的名作《新媒体的语言》之中已然给出了极具前瞻性的阐释。他围绕“数据库”这个要点展开论述。首先,“许多新媒体对象并不讲故事,它们没有开端和结局,……相反,它们是诸多单个项目的集合,每个项目都具有同等的重要性”6.这里,马诺维奇不仅明确点出了从叙事到造世这个根本趋势,而且还同样清楚强调了数据库逻辑这个数字影像得以造世的根本动力。数据库逻辑主要在两个关键点上有别于传统的电影叙事:首先,它们更强调不同要素的空间并置,而并非时间演变;其次,它们使得观众与影像之间的互动得以可能,由此将传统影院中的观影者转变为后电影时代的用户及玩家。这两面又密切相关,共时性的数据库给玩家的自由选择敞开了巨大空间,同样,玩家的随时互动、深入参与又不断丰富和拓展着影像的数据库。我们看到,用数据库的方式来创作电影,以玩家的身份来参与电影,这两个要点也正是Sora的本质特征。Sora的用户,完全可以没有任何电影专业相关的知识与技能,而只需要运用日常语言就能够与AI互动,进而迅捷高效地生成心目中的视频和影片。同样,扩散模型这个基本的方法,万物皆数据这个根本的原理,也都是马诺维奇囿于时代所限未及深入展开的数据库逻辑的切实的展现、具体的应用。或许马诺维奇自己从未真正使用过“后电影”这个说法,但他所倡导的“后媒介”这个术语也更强调的是从传统媒介到数字媒介的连续性演进而非否定性断裂。就此看来,作为后媒介的Sora也完全可以被视作是传统电影的延续和新生,而绝非死亡和终结。

然而,这个乐观的立场或许并不能得到普遍的认同。在亲密接触Sora的一些电影人的体验之中,人与机器、艺术与科技,乃至想象与计算之间难以化解的张力,仍然是目前阶段会屡屡遭遇的难题。比如,来自加拿大的电影制作团队“害羞的孩子”(Shy Kids)就已经利用Sora制作了一部相当前卫而生动的短片《气球头》(Air Head)。然而,虽然团队的创作者一向拥抱新技术,他们运用Sora所展现出来的视觉效果也足够令人赞叹,但在采访中,他们仍然表达了自己不失根据的担忧乃至质疑。7影片的主理人甚至毫不隐讳地批评到,OpenAI的技术专家只关注“影像的生成”,而全然忽视了电影艺术所独有的叙事逻辑和视听手法,包括运镜及蒙太奇的种种技法。在这篇访谈中,艺术与科学之争至少体现于两个方面。首先涉及影片的剪接。Sora的扩散模型固然可以在微观的层次上高效、快速地处理数据及其模式,但在电影的制作和观看的层次,它却全然无力,甚至无意去关切镜头之间的连接。两个镜头之间究竟该如何进行匠心独运的连接,不同场景之间到底要怎样进行赏心悦目的切换,Sora既不理解,更不关心。这或许也是为何,即便它已经比Make-A-Video、Runway这些视频生成模型更为快速、清晰而连贯(coherency),但仍然无法消除很多反物理的机制、冗余的细节、荒诞的运动。正是因此,《气球头》的关键创作者帕特里克·塞德伯格(Patrick Cederberg)就大声疾呼,应该让Sora更学会像一个“电影导演那样去思考”。不过,在目前阶段,这个倡议还面临着版权的难题而困难重重。比如,如果你给Sora发出指示,“请给我做一个费里尼式的蒙太奇”,它完全可能会直截了当地回答:“我做不到。”如果无法全面透彻地学习历代各位大导演的手法,以及史上各部经典作品的精髓,那么Sora又怎么可能真正精通电影式的思考呢?

其次,即便是在数据层次上,Sora对视频影像数据的处理也仍然存在着明显不足。诚如前文所述,Sora的基本运作原理正是将LLM转用于视频领域之内,进而衍生出LVM这个全新而极具前景的方向。8但仅就目前的进展阶段而言,如何在语言的逻辑和视觉的逻辑之间建立起真正的互通关系,仍然是一个亟待解决的难题。比如,如果要生成一个以香蕉为主题的视频,那么Sora的创作方法跟一般的电影创作者正相反,它并没有一个香蕉图像与影像的数据库,而是从“香蕉性”(banana-ness)的意义空间来入手。9这两种做法当然存在着很大区别。当基于语言的模型之时,创作者关注的是像“黄色”“弯曲”“水果”等等这些含义的特征,但反之,若从影像的模型出发,那么更应该在林林总总的香蕉图像之中进行比较、梳理、分类,甚至综合。从某种角度看,语言的空间要比形象的空间小得多,道理很明显,即便在日常生活中,也仍然存在着大量语言与形象不对应、不一致,甚至语言无法准确、生动、丰富地描绘形象的情形存在。从LLM到LVM,看来还是任重道远。

当然,Sora目前还存在着很多别样的缺陷,声音与音乐素材的匮乏就是其中之一。有鉴于此,仅依靠Sora自身,要想生成一部真正有品质的电影短片,还近乎痴人说梦。无论从创意、剪辑还是后期来看,人类创作者的参与都占据着不可取代的地位。Sora或许还无力导向电影发展的新阶段,它至多只能是作为辅助人类进行创作的工具和手段。

微信图片_20241024005622.png

Sora制作的短片《气球头》剧照

微信截图_20241024005557.png

然而,上述立场是否又太过轻视了Sora的那种将电影发展带向未来的巨大而未知的潜能呢?或许多少是对电影创作者们的质疑进行回应,Sora的重要开发者之一威廉·皮布尔斯(William Peebles)就结合有力的案例指出,Sora自己就具有原创的镜头剪辑的眼光和能力。比如,在他提到的分别以珊瑚礁和动物园为主题的两段视频之中,Sora都展现出了全然超脱于原初的语言提示的创造力,在场景之间形成了出乎意料却又极富艺术感的连接方式。10其实,回顾电影史的发展,也总是充满各种未知和意外的创造,像爱森斯坦和安东尼奥尼这样的大师在发明他们独创的蒙太奇手法时,也注定要突破各种常规与惯例。既然如此,为何不能放手让Sora去发明它自己的电影技法呢?也许这才是通往未来的后电影的可行途径?当然,有评论家也提及,虽然囿于版权和数据库的范围,Sora目前尚无力、无法大量学习电影史的浩瀚素材,但OpenAI已经奉献给我们的几支令人惊艳的短片确实多少暗示出电子游戏引擎式的生成能力。11经由电子游戏这个中介,Sora是否得以更为广泛、便捷地汲取丰富的电影资源呢?

对于从电影到电子游戏再到Sora的发展脉络,人们或许完全有理由持有乐观的态度和希望的憧憬。但问题在于,一旦将Sora纳入这个从胶片电影向数字影像、从迷影向后电影的转变过程之中,那么它似乎同样也要直面这个过程所隐含的各种隐忧甚至危机。在名作《电影效应》中,肖恩·库比特(Sean Cubitt)就将后电影概括为新古典主义等六大类型,而在其中,“新巴洛克电影”(Neobaroque Film)似乎最能彰显数字影像的本质特征,也由此最直接地暴露出其未来隐患。正是在这里,作为后电影的Sora也许同样感染了这个顽疾。

巴洛克近年来在学术界的再度走红,并非仅出于艺术史的兴趣,而更是因为它作为一种艺术风格和审美精神,在很大程度上直击数字时代之生存状况的敏感神经。早在《视觉之疯狂》中,格鲁克斯曼(Christine Buci-Glucksmann)就深刻揭示了巴洛克美学的悖论形态,即一方面是极为浮华璀璨的表象,无尽蜿蜒衍生的细节,令人目眩神迷的运动,但另一方面,在视觉之迷狂的背后,也同样是对视觉本身的否定与毁灭。12在膨胀蔓延的形象宇宙之中,视觉最终是“一无所见”,陷入无尽的空洞与黑暗的深渊。由此,她将光与暗、空(empty)与满(excessive)之间的戏剧性纷争视作巴洛克的根本逻辑。13在巴洛克的视觉迷狂的最深处,恰恰是断裂(rupture)、迷失、眩晕(vetigo)乃至空无(nothingness)14.

而在库比特看来,这个空与满、无与有之间的难以最终化解的否定辩证法,也恰好可以作为数字电影的一个根本特征。由此,他将新巴洛克电影的特征概括为“数据库叙事与情感蒙太奇”(Montage of Affects)这两点,15看似与马诺维奇在《新媒体的语言》中的阐述并无二致,实质上却构成了对后者的致命批判。在马诺维奇看来,数据库逻辑取代线性的、时间性的叙事,是未来电影的新生动力。但在库比特看来,数据库本身看似是一个巨大的空间迷宫、浩瀚的共时性汪洋,但它自身仍然形成了一个“黑格尔式”的宏大叙事,16它虽然没有明确的起点和终点,但却无尽地自我指涉,形成了一个封闭的循环。17在这里,主导的力量不再是情节或故事,而更是“模式”——无限重复的、自身封闭的、规则操控的结构与算法的模式。18这正是新巴洛克电影的核心症结所在。在那些光怪陆离、极具科技感和未来感的特效(effects)与景观之下,实际上隐含的唯有无尽的空洞(void)19、难以挣脱的数字漩涡和深渊。

对于用户参与这个马诺维奇所倡导的积极面向,库比特同样也表达了焦虑,甚至将主体性的丧失和否弃视作新巴洛克电影的又一个典型的负面效应。自我指涉和循环的数据库叙事,不仅核心和内里是无尽的空洞,而且同时也让观者和参与者化作自我否弃的幻影与幽灵。“我们只能与剧中人形成共情(empathize),而非认同(identify)。”20共情看似深刻,但实则只是被动接受影像作用的表面效应。认同的丧失才是最令人担忧的未来走向。认同的前提是主体对于自身的反思与关切,而在数字影像的新巴洛克宇宙之中,深陷无尽循环的迷宫与漩涡之中的主体又如何认同自身,进而认同彼此?所谓的参与,或许只能是数据海洋中转瞬即逝的浪花;所谓的互动,或许只能是数字宇宙中昙花一现的尘埃。情感的蒙太奇,最终只是空幻一场的共情游戏。

如此看来,Sora所生成的数字影像及其宏伟宇宙,不也正是此种巴洛克的悖论美学的极致展现?在它那极致光滑、流畅、连贯的数字表面之下,是否也同样隐藏着世界之空与主体之空的无尽深渊呢?确实,绝大多数研究者和评论者都会将“连贯性”视作Sora的最明显进步和最根本原理。21而自我相关正是确证、确保此种连贯性的基本途径。比如,在2023年发表的一篇合作论文之中,皮布尔斯已经将“自回归模型”(autoregressive models)作为视觉图像转换器的基本原理,22而到了Sora之中,此种自回归和自指涉的关系又成为一个突出的要点。只不过,除了作为技术的模型之外,此种自相关的原理还从根本上涉及LLM与LVM之中所揭示出来的人类以语言和影像来进行思考的独特方式。正是这个根本的维度才引出进一步的哲学反思。或许也正是在这里,突破新巴洛克牢笼的契机与途径得以展现。

在Sora这里,自相关大致体现为两个不同的层次和面向,一是感知的现象,二是算法与原理。首先,从感知的层次上看,Sora可以从一个图像或影像片段出发,在空间和时间之中进行不同方式的连贯性延伸。从空间的角度看,Sora更优于之前的视频生成模型的一个突出强势就在于,它可以很好地确保一个运动的物体在空间之中保持连续的轨迹。比如,一辆车开过面前,然后经过一座房子的后面再继续往前行驶。看起来这是日常生活之中的一个司空见惯的现象,但稍加探问,就会疑点丛生:那么,到底如何能够辨认(recognize)经过房子之前和之后的汽车是同一辆呢?汽车会不会在房子的后面突然消失,然后在另一端又突然出现呢?诚如斯特劳森(P.F.Strawson)所言,对同一个对象的辨识标准,必须预设空间与时间的统一性、连贯性(“这些指称的对象被设想为在一个单一、统一的时空系统中互相联系”23)。而在Sora诞生之前,AI生成的视频往往无法从根本上保证此种连贯性,因而经常会出现物体的荒诞运动。一个移动中的物体可能骤然出现或消失,一个运动至屏幕之外的物体再回来之时可能完全变了样子,等等,这些令人忍俊不禁的情形经常会出现。但Sora就很好地解决了这些问题,这也是为何它所呈现出来的世界显得如此真实。除了高清晰度之外,时空的连贯性和恒常性(constancy)也是真实性的一个重要标准。而从恒常性的角度说,这还涉及物体与环境之间的交互关系。比如颜色的恒常性,24就并非是始终保持同一个颜色(这反而是反常的),而更是能够在不同的光照条件和周围环境的背景之下,合理而又连贯地呈现出色调、层次、浓度的各种变化。这显然也是Sora的另外一个优势。

空间上的连贯也往往呈现出自相关的形态,因为无论是物体、物体自身的属性,以及物体在其中运动的空间,都需要在不断的变化之中一次次地“回归”自身,保持自身的稳定、统一与恒常,这是物理空间真实性的一个重要的本体论前提。在真实的空间之中,不能出现荒诞的运动、骤发的裂痕、不可弥合的差异等等,一切都应该被包容、“缝合”进一个光滑自洽、整齐划一的空间体系之中。而从时间上来说,自相关所确证和确保的连贯性在Sora这里有着更为极致而戏剧性的展演。在《视频影像的生成模型作为世界模拟器》这篇技术报告之中,时空的连贯性延展显然是一个突出主题。物体在空间的不同向度、不同方式的运动之中保持自身连贯,同样,它在时间之中的向前(未来)和向后(过去)这两个维度的连贯拓展也是Sora的一个拿手好戏。比如,我们面前、当下看到的是一个行驶中的空中缆车的镜头,而Sora可以从这个当下的状态出发,“还原”出它之前的运动轨迹,“预测”出它之后可能的运动方向。而在过去、当下、未来之间的转换与过渡,它都做得极为流畅,没有任何荒诞的裂口。时空的自相关在另外一个视频作品中达到了匪夷所思的境地,我们甚至目睹了一个山地自行车选手沿着同一段环路一次次的重复,一次次地返归原来的起点又重新开始。时间与空间,在Sora的连贯性魔法之下,形成了一个近乎“无缝的无限循环”(seamless infinite loop)25.“自然的一切状态都只是少数恒常法则的数学结果”26.拉普拉斯(Pierre-Simon Laplace)的这句名言或许道尽了真相:在Sora那异彩纷呈、极具艺术感的表象之下,其实是极为严格的近乎决定论的物理宇宙的模型。

微信截图_20241024005658.png

如此看来,Sora简直就是库比特所谓的新巴洛克电影在AI时代的最极致体现了。对于大银幕上的数字影像,其连贯性原理毕竟还要落实于不同导演所苦心孤诣地构思和营造的数据库叙事之中;但在Sora的设计师们眼中,完全可以且理应运用更为终极和基础的物理模型和世界构造去替代主观性更强、差异化风格更明显的叙事手法。仅从这个角度来看,Sora确实更接近严谨而客观的科学家,而绝非是想象力奔涌、个性张扬的艺术家。

但Sora所模拟的并非只有客观的物理世界,它同样可以生成出各种虚拟的、纯粹数字的时空。那么,在这个脱离了物理世界原型的数字宇宙中,Sora是否就终于能够挣脱连贯性原理的束缚,随心所欲地进行艺术创造了呢?似乎也并非如此。比如,OpenAI在重点提及Sora对电子游戏《我的世界》的模拟之时,稍令人意外地使用了“高保真度”(high fidelity)这个说法。这究竟何意?首先,这肯定不是指涉画面,因为这本身就是一个像素游戏,根本谈不上清晰度的问题。其次,这也不大可能仅意味着对游戏原作的忠实摹仿,因为似乎完全没有必要。那么,最后,这个“保真度”所涉及的理应是游戏运作背后的更为深层的算法、规则与原理。在游戏之中——尤其是那些所谓的开放世界游戏——玩家看似可以随心所欲地操作,但这个自由度仍然是有边界的,它始终要在预设的规则、引擎的能力等等的限度内才得以可能。所以,在一个游戏之中,最真实的并非只是界面和场景,而更是背后那个将整个游戏缝合在一起的连贯性法则。而Sora之所以要大费周章地去忠实摹仿《我的世界》,也无非是再度展示它在构建、实施连贯性原理这个方面的实力与强力。无论是物理世界中的决定论原理,还是虚拟世界中的算法与规则,都可以轻而易举地被Sora科学家式的大脑学习、破解、运用。

看似Sora以科学的自相关(连贯性原理)对电影艺术的自相关(新巴洛克风格)进行了极致的推进,那么,这是否意味着伴随着生成式AI的极速发展,主体性之自我丧失,世界之跌入空无深渊,就是不可逆的命运呢?也许不必如此悲观。这就涉及对自相关的另外一个层次的理解,它不再仅局限于界面和表象,但也远不止于背后的算法和原理,而更是涉及数据和数字的存在方式这个本体论的维度。要透彻阐释这一点,由此展现出Sora的否定性潜能,还是要回归LLM这个技术兼哲学的前提。

LLM模仿的是人类自然语言的运作方式,那么,何为语言,它到底如何运作呢?如今关于这个根本问题的讨论似乎都有必要从索绪尔的《普通语言学教程》入手。他所提出的语言与言语之分,以及差异化作为语言运作的基本原理,都为我们洞察LLM的本体论原理提供了关键线索。首先,语言不同于言语,语言是一套相对独立、抽象而自洽的符号系统甚至“社会制度”,而言语则是语言系统在具体的场景、个体的行为、不同的社会及文化背景之下的体现与实现。28语言是一,言语是多;语言是抽象的,言语是具体的;语言是符号的系统,言语是具身的行动。或借用意大利哲学家保罗·维尔诺(Paolo Virno)的经典阐释,理应由此在语言之中区分出“本体”与“经验”这两个维度:抽象独立的语言系统是各种经验性的言语行为的本体论前提。29

那么这个本体论的前提又究竟为何?难道仅仅是各种语法规则吗?不尽如此。索绪尔极具启示性地指出,语言本身就是在思想和声音“这两个无定形的浑然之物”之间运作的清晰化的秩序。30而这也就意味着,语言看似条理清晰、秩序井然,但它始终无法彻底挣脱那个“浑然”的、涌动着无限差异和强度的本源。正是因此,索绪尔进一步界定,语言之所以能够表达意义,其根本前提正在于系统中不同要素之间的最为根本的“负面的关系”,也即“不”“非”,或否定。31符号A“不是”符号B,要素A“不是”要素B,这就是我们能够在经验内容层次上进行言说的本体论前提。那么,此种“不”之否定又是怎样一种关系呢?维尔诺通过对柏拉图的《智者篇》的重读,尤其是对“héteron”(异)这个古老的谜样概念的重释,进而极为深刻地指出,“否定(negation)所表达的不是对立(contrary),而是差异(differrent)”32.说“这朵花不是红色的”,这并不(仅)意味着它的颜色与红色相对、相反(与红色相反的是哪一种颜色呢?),而是说,它的颜色“不同于”“有别于”红色,由此再度回归、指向了更大的差异性的意义空间。其实在维尔诺之前,海德格尔在对《智者篇》的长篇解读之中已经明确发现了这一要点:“一种进行揭开的否定,它恰恰在那被否定的事情中让某种东西被看。……从而否定自身就获得了生产性的性质。”33否定,并非仅仅是划界、区分,而更是通过返归差异性的本源而展现出更为根本的“揭示”之效、“生产”之力。

也正是在这个意义上,维尔诺重释了语言的“递归”(recursion)运作。34什么是递归?并非只是一次次重复既定的事实,也远非只是一次次回归抽象的法则,而更是从经验内容向本体论前提的递归,从言语向语言的递归,从肯定向否定的递归。也正是在这个递归的意义上,我们发现了LLM乃至LVM的自相关模型的别样的否定性潜能。不妨借用布洛赫(ErnstBloch)在《希望的原理(第一卷)》中的著名区分,“无”(nothing)不同于“不,否”(not)。“‘否’位于根源之中,它意味着依然空洞的、未规定的、未决定的东西,意味着趋向开始的出发点。反之,‘无’乃是某种确定的东西。”35由此看来,无论是新巴洛克电影,还是LLM和LVM的大数据模型,都理应存在着两种自我递归的方式,一种是一次次落入“无”之深渊,另一种则相反,一次次返归“不”之本源。前者从肯定性出发(连贯性原理),但最终导向的是空无的终极否定;而后者从否定起始(“not”,“不”),但由此却导向了那个充满强度和差异的原初场域,那个噪音与汪洋,36并从中汲取重生之力。这或许才是ChatGPT在语言之中、Sora在视频影像之中所真正展现的递归模型:前者会说,“我给出了一段文本,但我尚未(notyet)穷尽它的意义,也许它不是(not)你真正想说的”;后者也会说,“我做出了一段视频,但我尚未穷尽它的可能,也许它不是你真正想看的”。

这第二种递归,其实在视频影像的AI生成模型的前期阶段,已经初露雏形。比如,在2015年,三位软件工程师就已经利用神经网络的深度学习尝试了“否”的递归形态。37这包含着三个相关的步骤。首先,它的起点是“充满任意随机的噪音的图像”(an image full of random noise)。它是一片孕育、蕴含着无限可能性的无尽汪洋。其次,从这个原初的噪音开始,神经网络不断对其进行“降噪”,由此逐步生成相对清晰的图像。但神经网络本身是由不同的层级(layer)所构成的,其中每个层级所实施的降噪与抽象之功能也彼此有别。因此,着重于不同的层级,进行相应的增强(enhancement),最后所得到的结果也会完全不同,由此亦得以敞开很多意料之外的降噪途径。第三,正是神经网络的这个相对开放多元的模型提醒我们,那个原初的噪音汪洋其实从未被耗尽其生成的潜能,而是不断展现出创造与毁灭、生与死的双重双向的法力。从它之中,不断创造出千姿百态、难以预期的图像与形象,但这些被创造出来的清晰图像也时时面临着重新返归、跌入混沌的可能乃至风险。正是因此,在三位研究者做出的各种图像之中,清晰的轮廓与模糊的边缘往往并存而互渗,甚至往往给人一个强烈生动的观感,就是那些看似清楚明白的数字生成的图像,也随时准备重新“融化”在那无形的、流变的噪音汪洋之中。

Sora的“否”之递归也正近乎此种真幻交织、清晰与模糊互现的数字梦境。但这绝非只是虚无缥缈、天马行空的想象,而更是无比真切地揭示出其影像生成背后的那个本体论前提,那个“否”“不”与“尚未”的动机。在这个意义上,Sora确实有几分接近黑特·史德耶尔(Hito Steyerl)在名作《屏幕上的受苦者》中的深刻论述,不妨由此对其否定性潜能稍加阐发。首先,史德耶尔极为敏锐地指出了当下世界之影像的普遍“无根基”(groundlessness)状态。38不过在她看来,这并非仅指向空无的深渊,而是同样也展现出“否”与“尚未”的重生契机。无根基的影像,既来自普适而统一的透视框架的瓦解,又同时是疾速兴起的俯瞰与遥感技术的产物。在密布的卫星网络之下,在遍及各个空间尺度、极致清晰的Google Earth的版图之上,原本坚实的大地和根基(ground)被完全、彻底抽空,仅作为从空中沿着垂直向度投射的测量基准面。或许正可以在这个大背景之下来理解Sora的去根基性。它的命名来自日语中的“天空”,或许除了对自由想象的憧憬之外,也同样隐喻、影射着数字影像的那种“垂直霸权”39.Sora看似能够随心所欲、得心应手地生成出从现实到虚拟的各种图像与影像,但诚如上文所述,它的此种生成作用完全没有稳固持久坚实的根基,因为它的起点总是那片混沌的噪音与汪洋,因而它也总是有可能重新跌入那个模糊不清、含混莫辨的空幻梦境之中。

然而,Sora的影像又并非只是新巴洛克电影那般的全然空洞、虚幻漂浮、自我重复的数据库叙事,它的第二种递归不断敞开了由否定至肯定、死而复生的极致可能。诚如史德耶尔的豪迈之语,面对这样一个无根基的时代,面对着各种垂直俯瞰的数字技术,我们到底应该做出怎样积极的回应呢?在何种意义上还能唤醒重生的可能、抵抗的契机呢?那正是“毫无保留地向物体坠落,拥抱力量和物质的世界,即使这个世界没有任何原初的稳定感,即使其只会在震惊中激发出敞开的可能性,……坠落是堕落也是解放”40.这几乎可以作为Sora影像之未来生命的警世恒言。Sora是天空,但它兼有双重含义、两个方向。它既可以是抽离一切物质性和肉身性、不断将万事万物连根拔起的“上升运动”,由此承诺着在数字天国中拯救一切的终极信条。但同样,它也可以反之成为勇敢的、义无反顾的下降和坠落。即便根基已然土崩瓦解,但在堕入深渊之际,我们仍能够感受到自身的重量与速度。如何在去根基的运动之中重新激活数字影像自身的物质性和肉身性?如何令我们不是在漂浮无根、高清连贯的数字梦幻中醉生梦死,而更是在极致混沌但又无比鲜活的数字肉身中痛彻体验,顽强挣扎?这或许是Sora之“否”的递归、去根基的坠落所正在书写的最令人警醒的未来启示录。

微信截图_20241024005723.png

在一个无根基(groundless)的时代,理应以去根基(ungrounded)的“弱影像”(poor image)来进行积极的回应。“弱影像是当代的屏幕上的受苦者,是音像制品的残渣,是冲上数字经济海岸的垃圾,其存在证明了影像剧烈的错位、转移和置换。”41虽然Sora现在还处于初生阶段,尚未进入市场与公共领域,但仍有可能从弱影像的角度对其影像政治的潜能进行两点提示。

首先,影像政治贯穿于史德耶尔的各种论述,但其要旨恰可以用她重点提及的《后—根基的政治思想》(Post-foundational Political Thought)一书的标题来明示。“后根基”,正是直面无根基的时代状况,但又并非仅安于“偶然性根基”这个折中和妥协的方案,42而更是在海德格尔(尤其是《哲学论稿》中的深奥阐述)的“离—基”(Ab-grund)之意义上保持一种极端而毫不妥协的动态。43这或许也是我们对待Sora未来发展的一个更为明智的态度。它远非既成之物,而更是未来之物。它远未耗尽可能,而更是充满未知。它不是“已经”,而更是“尚未”。这才是它作为否定性影像的真正内涵。

其次,由此也就要求我们对Sora进行一种更为广泛而深入的政治经济学的考察。Sora并非只是一个技术的发明,甚至也并非仅涉及市场和商业的宣传运作,而更有可能关涉对人类社会和生存的全面深入的变革。既然Sora的连贯性原理深刻影响着人类思考世界的方式,它的高清格式深入掌控着人类感知的基本框架,那么,它的双重递归的方式也注定将不断加剧垂直俯瞰时代的无根基状况,把虚无主义(nihilism)的顽疾一次次打入个体灵魂的最深处。由此,创伤和苦痛的体验或许就成为重启影像政治的一个真正起点。无根基的空无体验,由此所激发的离基的行动与勇气,才是朝向未来的另一种可能。

Sora,将化作倒悬的天空,它不再提供我们虚幻的拯救,而是将我们一次次抛入死而复生的“尚未”。作为后电影和弱影像的Sora,或许也注定将成为电影的下一次凤凰涅槃的生命。


相关文章    更多>>

推荐文章