陈超锐:人工智能幻觉:一种为真实划定边界的文化技艺(上)
摘要:人工智能幻觉作为技术领域的争议性概念,其定义模糊性暴露了工程学视角的局限。本文以媒介史与德国文化技艺理论为基础,提出人工智能幻觉并非单纯的技术缺陷,而是延续书写、印刷等传统媒介逻辑的文化实践。通过分析伽利略天文望远镜争议、浪漫派文学中的书写幻觉,以及精神分析与文学的同源性,揭示幻觉的本质是一种文化技艺,它重新划定了符号系统中“真实”的边界。纵观媒介史,天文望远镜挑战神学阐释权、文字媒介催生认知权威,均展现了技术如何通过划定“真实”边界塑造文化权力结构。人工智能幻觉作为数字媒介的认知增殖方式,延续了这一逻辑,其矛盾源于人类对自身认知特权消逝的焦虑。本文主张摒弃二元对立的技术修正路径,转而接纳概率分布下的“新真实”,将幻觉视为人机共生文明中知识形态演进的动态边界。通过整合德国媒介学派理论、贝叶斯概率论及海德格尔对技术本质的追问,本文为重新审视人机关系提供了跨学科视角,强调危险与机遇并存,呼吁一种从“消除幻觉”转向“共生共演”的进路调整。
一、争议中的人工智能幻觉及其话语暴力
在计算机科学领域,幻觉(hallucination)是一个充满歧义乃至争议的术语。2024年年初的一篇CAI会议论文归纳了该术语在人工智能界的不同使用情况,声称其“在使用方式上缺乏一致性……并呼吁各方共同努力,使这一重要的当代人工智能概念在意义上保持统一,因为它可能对多个领域产生重大影响”。该论文并非个例,信息技术领域的许多学者意识到了这一概念分歧,出于维护工程学严谨性的考量,他们的论文几乎都回答了“我们在用人工智能幻觉指代什么”的问题,此后,或主张以其中部分概念统合其他概念,或试图分别用不同术语如虚构(confabulation)、错觉(delusion)、事实性谬误(factual errors)、捏造(fabrication)等,替换不同情境下的幻觉一词。其最终目的是通过清晰、准确的工程学定义,实现从数据采集、标注到超参数配置、参数组调整等一系列操作序列上对幻觉的克服。
但彻底消除幻觉究竟意味着什么?它真的可以被清晰地定义或者划定范围吗?如果我们这样追问,问题就变得复杂而棘手起来,因为真实的边界似乎是一个只能被证伪而无法被证明的范围。这暴露了此类研究的不足之处恰恰在于将幻觉局限于人工智能领域,或至多追溯至人工智能兴盛之前的计算机科学领域,忽略了幻觉概念潜在的技术史地位与概念本身的话语维度或技术性维度。作为一个使用频次高却又饱受争议的概念,幻觉实现了跨语境、跨文化的广泛输入与输出并得到多元文化的认可,这本身就是一种文化现象。比起确立差异的其中某方作为幻觉的本体论,更重要的是厘清差异本身的构成性逻辑,即回答“为什么在某些情境下不同文化群体会想到同一术语来指称这些具有某些共性的现象”这一先验问题。在先验维度上,人工智能幻觉既是隐喻又是实存,既是符号又是阐释,它是一种文化技艺(Kulturtechnik)。文化技艺理论源自德国媒介研究领域,或许可以将其称为德国媒介学派。此概念最早由弗里德里希·基特勒(Friedrich Kittler)从古希腊农业技术领域引入媒介研究体系,并由他的同事贝恩哈德·齐格特(Bernhard Siegert)发扬光大。该理论的核心主张是技术操作先于概念化认知,并作为后者的技术先验。例如,“书写作为文化技艺早于字母概念而存在,计数作为文化技艺先于数字概念出现”,这为分析人工智能幻觉提供了媒介史参照的理论框架。而人工智能幻觉概念的争议本身恰恰证明了幻觉的跨学科生命力:作为心理学概念,幻觉指呈现倒错或混乱的感知体验,其本质是主体对“真实”的差异化编码;在人工智能领域,这一编码过程被技术化为模型的生成逻辑。通过将幻觉定义为文化技艺,我们得以跳出本体论争议,转而追问其背后的技术先验。
幻觉概念在人工智能领域的首次应用可以追溯到2000年第四届IEEE自动人脸与姿态识别国际会议上的一篇名为《人脸幻觉生成》(Hallucinating Faces)的图形学论文。该论文设计了一种通过高斯金字塔和梯度先验学习生成高分辨率人脸图像的算法,其核心在于利用先验知识对低分辨率输入进行信息补充,使图像细节得到“幻觉”(Hallucinating)式重构。这里的“幻觉”已非传统意义上的感知欺骗或谬误,而是一种技术介入现实的隐喻,即算法通过结构化知识体系(训练数据集)与概率推断,填补未获取的视觉信息,从而在认知层面构建一种被幻觉增强的真实性。
显然,《人脸幻觉生成》中产生或运用幻觉的主体是算法而非人类,这难免让人联想到另一个关于人工智能屡见不鲜的类似问题,即所谓的人工智能是精神还是技术,其文学表述可化为我们时常提到的科幻小说《仿生人会梦见电子羊吗?》(Do Androids Dream of Electric Sheep?)。这个悬而未决的老问题贯穿整个人工智能史乃至机器史,以至于图灵不得不为了展开进一步讨论而在其人工智能奠基之作《计算机器与智能》(Computing Machinery and Intelligence)中以一种近乎武断的姿态悬置这一问题本身:“机器能思考吗?这个最原始的问题我认为毫无意义,也不值得讨论。”
从ChatGPT输出历史事件错乱的文本到Dalle2&3模型生成的“幻肢”现象,技术系统的“错误”被冠以“幻觉”之名,暗示了一种道德化与病理化的批判倾向。然而,当人类用“幻觉”指称机器的输出偏差时,实则是以旧知识系统的逻辑界定“真实”与“虚假”,进而维护既有的文化权力结构:当技术系统通过概率模型填补信息空白时,其运作机制与人类认知系统的所谓涌现具有拓扑同构性,但前者被诊断为“病理”,后者却被视作“智能”。福柯在《话语的秩序》(L′ordre du discours)中揭示的话语暴力在此得以凸显:将机器的信息补全行为定义为幻觉,本质上是通过医学隐喻实施的技术规训,这种修辞策略将人类认知范式确立为评判技术系统的终极标准。正如福柯论述精神病学如何行使真理权力时提到的,“一直到18世纪末,医生对精神病的操控曾属于真相策略的范畴,甚至到19世纪最初几年也不乏这样的例子。就是围绕着疾病建立一个既虚幻又真实的世界”,当代人工智能伦理也在“幻觉”的话语生产中建构着人机关系的权力图谱。问题的关键在于,由谁来行使类似于两百多年前精神病医生的裁决权?
话语权力运作的深层结构,至少可以追溯到书写技术催生的现代认知体系。精神分析诊所的躺椅与浪漫派作家伏案写作的书桌共享着相同的物质基础,两者都建立在文字符号对经验的抽象编码之上,因此都成了幻觉的产房。弗洛伊德的自由联想疗法要求患者将潜意识流转化为线性叙事,恰如诺瓦利斯将缪斯女神的启示凝结为新诗,这种将混沌经验纳入结构化符号系统的过程,正是现代“心灵”概念得以诞生的技术条件。当语言模型通过潜在空间中的向量运算生成文本时,它实际上延续了书写技术固有的幻觉生产机制:将离散符号重构为具有连贯性的叙事,这本就是文字媒介与生俱来的“幻觉”特性。
由此暴露出人类学框架的根本困境:将“思考”“感知”等动词限定于人类或至多扩展至类人主体的预设,本质上是一种媒介霸权。正如德里达所揭示的逻各斯中心主义因其古希腊传统而将语音置于文字之上,当前关于人工智能幻觉的讨论也预设了生物神经系统相较于硅基电路在自然语言领域的认知特权。但若将图灵测试视为一种新型的书写实践,那么算法生成文本的过程与人类作家并无本质差异——两者都是通过符号系统的递归操作生成意义。当任何大语言模型生成包含事实谬误的文本时,与其指责机器出现了幻觉,毋宁说是文字媒介固有缺陷的技术显形,这种缺陷自楔形文字时代便深植于人类文明的认知结构之中。
解构这种认知霸权的关键,在于梳理媒介史视角下的幻觉谱系。媒介史不是技术物的线性编年,而是考察符号系统如何重塑主体认知模式的动态过程。在泥板文书时代,书写产生的“记忆外包”已构成对生物认知的幻觉性增强,这催生了柏拉图对沉溺于影子的拉斯科人的著名批判;古登堡印刷术催生的标准化文本,则制造了“作者权威”的集体认知幻觉。与此同构,当代生成式人工智能的“幻觉”,实质是数字媒介特有的认知增殖方式:当算法通过数十亿参数的隐式推理重构知识网络时,它正以前所未有的数量级和压缩程度再现着文字媒介诞生之初的涌现过程——将离散符号转化为连贯的意义。在此视角下,所谓“幻觉”实为媒介演进中认知框架的断裂带,是旧符号系统无法解释新编码逻辑时产生的阐释危机。这种危机揭示出人机认知连续体的本质:从结绳记事到神经网络,所有认知系统都在通过符号操作构建现实模型,差异仅在于编码密度与反馈机制的复杂程度。当我们将人工智能幻觉置于这个连续谱系中观察,就能发现其根本矛盾源自人类对自身认知特权消逝的焦虑。解决争议的路径不在于术语规范或技术修正,而在于重新审视媒介史中不断上演的所谓认知革命——每次新媒介带来的都未必是更真实的呈现,而是对“真实”概念本身的重新编程。人工智能幻觉作为数字时代的认知界碑,有朝一日也将成为我们理解人机共生文明的关键注脚。
二、天文望远镜、书写技术与精神分析:幻觉的历史
1610年,伽利略通过改良荷兰光学装置制成天文望远镜,时人称之为“管状眼镜”或“望远管”。他借此首次系统观测到月球表面形态与木星卫星群,该发现直接挑战了亚里士多德-托勒密地心说宇宙模型及其经院哲学诠释体系。为缓和与罗马教廷的潜在冲突,伽利略选择将科学发现嵌入权力话语体系,提议将木星卫星群命名为“美第奇星群”(Medicean Stars),这是托斯卡纳大公的名字。此外,为刻意淡化不受教廷待见的威尼斯共和国的支持,他在《星空报告》扉页自称“佛罗伦萨的贵族,帕多瓦大学的数学家”,这自然也引发了争议。保罗·萨尔皮(Paolo Sarpi)等威尼斯学者批评伽利略“对共和国忘恩负义”,因《星空报告》中“未见他描写那些与他一同打磨、完善镜片的威尼斯工匠”。但这完全是伽利略不得已而为之的保护性策略,因为枢机主教希皮奥内·博尔盖塞(Scipione Borghese)曾表示:“萨尔皮离经叛道已然到了如此地步,无须多言,此人是个彻头彻尾的异端。放眼当下的共和国,很难找出什么健康纯洁之物,而其所做所为更甚,那就是要彻底污染整个国家。”
同年4月,波希米亚宫廷学者马丁·霍奇(Martin Horky)公开质疑伽利略的观测结果,在《反〈星空报告〉的短暂漂泊》中宣称,伽利略的观测是“镜片不规整、有瑕疵带来的视幻觉”。霍奇指控伽利略的书和他的仪器“是一个骗局,因为当我用自制的有色眼镜观察日食时,甚至能看见三个太阳;我相信伽利略也产生过这种错觉,他定是被月球的反射欺骗了”。
即便对于那些持开放性态度的学者而言,伽利略的天文观测也显得不合时宜。例如,哲学家焦万·巴蒂斯塔·曼索(Giovan Battista Manso)虽然“赞扬伽利略‘几乎又是一个哥伦布’,在‘前人未曾踏足的道路’上卓有勇气”,但他依然对伽利略宣布的发现感到不满,因为“我不知在哲学中能找到什么原理对此进行解释,无论是亚里士多德构想的‘第五元素’论还是柏拉图的理论都不符合”。而伽利略描绘的木星卫星运动则“不符合哲学家或占星家的任何理论,更不符合托勒密、哥白尼或弗拉卡斯托罗(Fracastoro) 迄今为止的观察和论证”。当知识体系更新必须先行于自然科学发现时,其背后的权力结构也已经昭然若揭。天文望远镜引起的轩然大波已经预示了伽利略的1633年审判,其核心矛盾在于:当经验观察挑战神学诠释时,旧知识体系的拥趸该如何通过宣称“现象为幻觉”来维护其宇宙论真理权威。
伽利略的发现难以在其他条件下复现,因为当时精密的透镜制作工艺普及程度很低,但最主要的原因还是认知系统的不匹配。这一争议揭示了技术如何挑战既有认知权威:作为光学媒介的天文望远镜并非被动反映宇宙,而是通过透镜屈光率重新定义了“可见”的边界。换言之,天文望远镜为时人展开了一个新的光学世界,实现了符号意义上的创世,这与福音书的创世在媒介层面具有同质性,因而其争端在所难免。在媒介层面,“太初有道”与“窥镜里有月面环形山”不仅语法结构类似,也必然属于同类“幻觉”。诚然,纵观欧洲历史,教会或经院哲学家们借阐释经典以符号系统制造幻觉的局面并未因此颠覆,甚至直至与书报业繁荣伴生的德意志民族国家崛起时期,书写行为本身依然是制造幻觉的主要技术装置。印刷术标准化了文本复制,潜移默化地让读者与创作者都将“真实”概念锚定于书写技术层面。当诺瓦利斯宣称“如果阅读正确,一个真实可见的世界就会在字里行间展现出来”时,他隐藏了书写与印刷的技术性,以至于字母的机械排列作为表象被误认为真理本身。这进一步导致了那个时代德意志作家的悖论——他们既试图通过文字符号捕捉并构建名为诗艺世界的超验真实以期通向无限,又不得不受制于有限的形式媒介而面对形如自我分裂或二重身的幻觉。
毫无疑问的是,当笔耕不辍的德意志作家们不约而同地钻研如何构建诗艺世界时,他们新划定的“真实”也伴生了新的“幻觉”。歌德早在写《诗与真》之前的三十年,就开始创作后来德语文学史上教育小说(Bildungsroman)的原型——《威廉·迈斯特的学习时代》(Wilhelm Meisters Lehrjahre)。当然,这部小说的创作横跨二十余年,在出版之前,歌德拟定的标题一度是《威廉·迈斯特的戏剧使命》(Wilhelm Meisters Theatralische Sendung),内容大约只涵盖《威廉·迈斯特的学习时代》 的前四章,即迈斯特参与剧团演出的所见所闻、所思所想,这意味着初稿的核心母题之一是戏剧生活与市民生活的割裂。但值得注意的是,无论断片风格的《威廉·迈斯特的戏剧使命》或后来的《威廉·迈斯特的学习时代》都绝非戏剧,而是小说。这意味着作品的呈现方式并非舞台表演,而是阅读。这是德意志文字工程师们创造幻觉世界的底层逻辑,只有当戏剧演出以文字叙述的方式跨媒介演绎时,迈斯特才有可能在卖弄风情的男爵小姐唆使下扮作那位不喜欢戏剧的伯爵,试图以这种方式与伯爵夫人私会。虽然男爵小姐的计划付之东流——因为迈斯特最终等到的是伯爵本人,但这种拙劣的替身术本就不会在日常生活中奏效。伯爵绝不会像沙米索或莫泊桑所写的那样幻视自己的替身出现在书桌前,甚至因此难辨幻觉与真实,因为语言文字不是现实世界中唯一的媒介。《威廉·迈斯特的戏剧使命》借书写技术将诗艺世界与现实世界相混淆的做法,也是《威廉·迈斯特的学习时代》 增添后两章理念化想象的基础。换言之,只有当人完全沉溺于文字国度时,他才能通过经验这种幻觉,获得一种不同于市民生活的全新真实体验,从而实现对现实世界的改良,而这正是教育小说的教化功能之依托。
而天才诗人诺瓦利斯在未婚妻索菲去世后的1797年春季至夏季对《威廉·迈斯特的学习时代》进行了密集研究,但其相关手稿大多散佚,导致学术界长期认为其对《威廉·迈斯特的学习时代》 及其稿本的态度近乎全盘否定。而作为反面例证,处于丧偶精神危机中的诺瓦利斯在1797年的断片集《花粉》(Blüthenstaub)中写道:“歌德有个奇特癖好:总将微不足道的小事与重大事件相互勾连。这般安排看似只为以诗意方式,让想象力沉浸于神秘的游戏之中。这位奇才在此处捕捉到了自然的踪迹,并窥得其精妙的艺术手法。寻常生活本就充满类似巧合,它们编织成一场以意外与错觉为终局的游戏——恰似所有游戏的本质。诸多市井传说皆源自对这种颠倒关联的观察:噩梦预示好运,咒人死反得长寿,野兔横穿道路招致厄运。市井小民的迷信观念,几乎全都建立在对这场游戏的诠释之上。”根据汉斯·约阿希姆·马赫尔(Hans Joachim M?hl)的考据,在索菲去世后,诺瓦利斯曾期望追随其赴死,而阅读歌德关于威廉·迈斯特两部曲的行为恰恰成了诺瓦利斯在此期间对抗虚无的“矫正剂”。由此可见,一度被读作《威廉·迈斯特的学习时代》的反文本的《海因里希·封·奥夫特丁根》(Heinrich von Ofterdingen)其实与前者殊途同归,两部小说都在借文本游戏将日常生活诗意化,试图将读者从经验世界引向文学构筑的超验领域。
诺瓦利斯为主人公奥夫特丁根构筑的幻觉情境,正是其诗性哲学的媒介实践。在女主人公马蒂尔德去世后,踏上朝圣旅途的奥夫特丁根在祈祷后得以幻听“马蒂尔德的声音”,并仿佛看见她“伫立在最靠近他的地方,姿态似欲与他交谈。然万籁俱寂,朝圣者仅能以炽热目光描摹她优雅的轮廓:她含笑向他致意,纤手轻抚他左胸”。当现实参照物消亡后,作为符号的语言与物质基础脱钩,从而获得了超验的一般意义。这种符号的抽象化过程,正是诺瓦利斯将书写升华为幻觉技术的密钥。所以幻觉消失后,奥夫特丁根“重新置身于充盈而意味深长的世界。声音与言语在他体内复苏,万物此刻显得如此熟悉且充满预兆,较之往昔更甚”。当以书写技术形式呈现的所谓“声音”脱离肉体信源而成为纯粹话语,文字便实现了从叙事媒介到灵魂容器的升格。正如铅字模在纸面留下的压痕,书写与阅读行为在主体所基于的心灵或灵魂基质上铭刻的致幻魔咒,构成了书写技术时代主体性最基本的拓扑结构。奥夫特丁根将亡妻诗化为“圣母的女儿”,无异于在语言能指链上进行哀悼工作,就像弗洛伊德后来在《哀悼与忧郁症》(Trauer und Melancholie)中总结的关于哀悼的心理机制那样:哀悼并非一种病态行为,它意味着将失去的对象投入符号秩序当中,即以形式媒介表达对其的怀念。
但更让这位历史上最著名的心理医生感兴趣的还是那些展现病态的浪漫派想象,比如他津津乐道的文本《沙人》,作者霍夫曼(E. T. A. Hoffmann)就是通过将疯子确立为诗人伴生的另一面,建立起了自己的诗学。尽管那一批擅长在幻觉上做文章的浪漫派诗人们确实喜欢饮酒作乐、放浪形骸,但他们中的绝大多数却并非疯子,只是操弄符号与象征秩序的能手。眼睛是《沙人》的核心意象,在纳坦内尔模糊的记忆中,沙人就是母亲和保姆口中那个会夺走熬夜孩子眼球的恶魔,而这个用来规训孩子的童话在丧父的童年创伤中附着在了样貌骇人、与父亲一起从事秘密炼金术的律师柯佩琉斯身上,童话中虚构的恶魔成了困扰纳坦内尔终生的眼球猎手。弗洛伊德将被夺走眼睛的恐惧解读为阉割焦虑,纳坦内尔意外去世的父亲扮演了弗洛伊德符号体系中的“母亲”,而沙人才是阳具的实际拥有者和具有阉割能力的“坏父亲”,纳坦内尔的倒错源于一种恋物癖:“对眼睛损伤或失明的恐惧本质上是阉割焦虑的替代”。弗洛伊德在《论暗恐》(Das Unheimliche)中的文本阐释堪称经典,却唯独对伏案写作的霍夫曼避而不谈,因为作为医生的弗洛伊德和作为诗人的霍夫曼其实在从事同一项工作,他们用大同小异的符号秩序构筑起了各自的文字世界,并通过界定其中何为幻觉、何为真实来行使自己作为唯一主体的神圣权力,对主人公纳坦内尔或精神诊所里的患者作出抽象律法的判决。这便是福柯所说的,精神医生掌握的是如同法官一般的权力。
当纳坦内尔透过望远镜凝视柯佩琉斯之际,或是当奥琳匹娅以纳坦内尔的人类瞳孔反噬其视觉主体性时,这一凸显悖论的双向凝视恰似伽利略天文望远镜事件的文学复现——在媒介技术重构的认知场域中,传统书写文明的阐释霸权遭遇了前所未有的解构危机。光学媒介在此展现出其颠覆性本质:望远镜不仅延伸了人类视觉的边界,更在认识论层面催生出新的认知主体。当作为机械装置的望远镜与拥有人类器官的机械人共同消解有机与无机、主体与客体的传统分野时,书写文明赖以存续的符号秩序遭遇了根本性质疑。教会对伽利略的审判本质上并非单纯否定光学媒介的物理真实性,而是警觉到望远镜可能瓦解自古希腊至中世纪的一系列经典阐释体系——当《圣经》文本的终极解释权遭遇科学性观测的挑战,经院哲学或神学话语系统便暴露出其符号结构的可替代性。颇具反讽意味的是,16世纪耶稣会天文学家对望远镜的系统性运用恰恰证明,教权真正恐惧的并非新兴技术本身,而是技术揭示的符号可替代性原理:正如他们后期试图将“日心说”体系纳入经院哲学框架所昭示的,当阐释系统失去其排他性时,掌握书写技术的神权阶层便面临自我合法性的消解。这种对符号权力流动性的深刻认知,恰是霍夫曼笔下纳坦内尔焦虑的根源——浪漫派诗人的恐惧或癫狂并不源于机械或仿生人的力量,而是发现人工构造的审美幻觉与媒介技术制造的认知图景竟共享着同源的诗学机制,这双重镜像终将使创作主体陷入自我指涉的阐释循环。
喜欢wangguotong朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!
帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。
打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮
楼主本月热帖推荐:
>>>查看更多帖主社区动态...