中国人工智能的真正威胁

送交者: 真者 [☆★★声望品衔11★★☆] 于 2025-03-01 14:50 已读4440次 2赞 大字阅读 閱讀
中国人工智能的真正威胁

美国为何需要引领开源竞赛

【作者】[美] 贾里德.邓蒙 【来源】《外交事务》杂志【编译】真者

在一家名为DeepSeek的鲜为人知的中国公司发布强大的新开源人工智能模型两个月后,这一突破已经开始改变全球人工智能市场。DeepSeek-V3是该公司开源的大型语言模型 (LLM),其性能可与 OpenAI的 ChatGPT、Anthropic的 Claude和 Meta的 Llama等美国顶级实验室的模型相媲美,但成本仅为它们的一小部分。这让全世界的开发者和用户都能以最低的成本获得最先进的人工智能。今年1月,该公司发布了第二个模型DeepSeek-R1,其功能与 OpenAI的高级模型o1相似,但价格仅为后者的5%。因此,DeepSeek对美国在人工智能领域的领导地位构成了威胁,为中国获得全球主导地位铺平了道路,尽管华盛顿努力限制中国获得先进的人工智能技术。

DeepSeek的迅速崛起,表明全球人工智能的竞赛是多么地重要。除了收获人工智能非凡的经济潜力之外,一个塑将造未来应用程序和服务的大型语言模型的国家,不仅会对这些大型语言模型下载所蕴含的规范和价值观产生巨大影响,而且还会对构成人工智能计算基础的半导体生态系统产生巨大影响。中国和美国都清楚地认为,这些技术可以提供军事优势,这一事实只会提高实现和保持人工智能长期领先地位的重要性。

然而,观察家们在关注 DeepSeek-V3的性能特点和低成本时,可能忽略了一个更重要的理解。DeepSeek模型之所以能被迅速采用,另一个关键原因是,它是开源软件, 这意味着任何人都可以下载、运行、研究,修改和构建这些模型,而且只需支付原始计算力所需的费用。相比之下,几乎所有同类的美国人工智能模型都是私有的,这既限制了它们的使用方式,也增加了用户的成本。

美国人工智能界的主要成员已经开始承认其强调私有、闭源模式的问题。1月下旬,OpenAI首席执行官阿尔特曼(Sam Altman)表示,未能拥抱开源人工智能,该公司可能 “站在历史错误的一边”。今年 2月,谷歌前首席执行官施密特(Eric Schmidt)预测,在未来,开放和封闭的人工智能模型都将影响日常应用。显然,美国不能再仅仅依靠大公司的封闭式人工智能系统来与中国竞争,美国政府必须加大力度支持开源模型,尽管同时努力去限制中国获得尖端芯片技术和训练数据。为了继续保持主导地位,美国应该启动一项综合计划,开发和部署最好的开源大型语言模型。但美国也必须确保美国公司仍然是建造能力最强的人工智能系统--有时也被称为 “尖端系统”--的公司,而这些系统很可能就在资本雄厚的私营公司中。

与此同时,华盛顿应推行更广泛的政策议程,既加强美国开源人工智能在国际舞台上的定位,又使美国能够建立保持人工智能领先地位所需的核心基础设施。这意味着不仅要支持美国开源模型的开发,还要让开源贡献者和用户,特别是与美国结盟的工业、学术和公共部门的贡献者和用户,能够方便地使用这些模型。如果华盛顿不采取这样的措施,DeepSeek将为不远的将来指明这个方向:中国可能会利用廉价、强大的开放模型,在人工智能应用和计算方面超越美国,从而有可能将21世纪最重要的技术之一置于一个敌视自由和民主的国家的控制之下。

开源优势

虽然开源人工智能在美国政策界受到的关注可能不如尖端系统,但它长期以来一直支撑着该领域的技术进步。事实上,在 ChatGPT于2022年横空出世后不久,人工智能社区的成员就开始将今天的大型语言模型与传统计算机的一个感谢开源的主要组件--操作系统--进行类比。正如操作系统将人类友好的计算机程序转化为机器硬件执行的指令一样,大型语言模型是人类语言与机器处理的信息之间的桥梁。事实上,对于开源人工智能模型而言,这种类比还延伸到了传统计算机的另一个方面:正如开源 Linux操作系统长期以来与微软的 Windows等专有操作系统并存,从而允许用户和开发人员自由下载、使用和修改其源代码一样,Meta的 Llama等开源 LLM也与 ChatGPT等私有大型语言模型并存,从而有望普及为下一代软件提供动力的智能系统。随着这些功能强大的开源大型语言模型的出现,研究人员将当前的时代描述为人工智能的 “Linux时刻”。

一般来说,Linux等开放源码软件项目由于能够得到世界各地程序员的改进而变得更加强大。由于系统可以同时由人类最优秀的工程师进行测试和改进,这种多样化的投入使得系统得以快速开发并提高了安全性。此外,由于开放源码软件项目历来倾向于由美国和欧洲的实体来维护,几十年来,开放源码软件推动了西方在许多领域的技术创新和领先地位,包括操作系统、网络浏览器、数据库、加密,甚至编程语言。

许多研究人员奉行开放源码软件原则,几乎每天都分享和发布新的创新成果,从而加快了人工智能的发展。这不仅适用于学术界--他们的动机是广泛传播自己的研究成果;也适用于人工智能公司--他们将参与开放源码软件社区作为一种有效的招聘、解决问题和公共关系策略。事实上,一些对开源人工智能最重要的贡献都是由大型企业主导的。这些贡献包括谷歌的 TensorFlow和 Meta的 PyTorch,它们是应用最广泛的人工智能编程框架;支撑大多数现代大型语言模型的 Transformer架构,最初是由谷歌开发的;以及 AlphaFold等模型,这是 DeepMind建立的人工智能系统,可以准确预测蛋白质如何折叠,其开发者因此获得了 2024年诺贝尔奖。几十年来,这种开放精神使人工智能成为一个令人兴奋、快速发展的领域,也是开放式大型语言模型具有巨大技术和经济潜力的主要原因之一。

但长期以来,开源系统与潜在的安全风险之间也存在着根本性的矛盾。以开源计算为例,批评者警告说,开源人工智能可能会被恶意行为者滥用。出于这些担忧,再加上商业考虑和竞争压力,许多大型人工智能公司开始通过聊天机器人或其他门户网站提供尖端的人工智能系统,而不是公开发布。事实上,在最常用的美国大型语言模型中,只有 Meta的 Llama是开放系统。而 Llama已经引起了人们的关注,路透社在 2024年11月报道称,中国政府已经将其改造用于军事目的。

然而,DeepSeek-V3和功能更强大的 DeepSeek-R1的发布,使开源人工智能的明显优势再次成为焦点。出口管制限制了 DeepSeek对尖端芯片的使用,然而,DeepSeek还是完成了一次工程技术上的壮举,实现了算法改进和硬件效率的提高,使它的开源大型语言模型能够与美国的顶级专利大型语言模型相抗衡。尽管人们对 DeepSeek建立模型所使用的计算能力还存在争议,但几乎可以肯定的是,DeepSeek所使用的计算能力远远低于美国竞争对手。事实上,DeepSeek的大型语言模型运行成本非常低廉,而且在开源领域非常广泛,因此已经开始为大量新的应用提供动力,而这些应用在其公开发布之前在经济上是不可行的。虽然这并不意味着像 DeepSeek这样的开源大型语言模型将占领整个市场,但对它们的快速和压倒性的反应不容忽视。自今年年初以来,DeepSeek的应用已取代 ChatGPT在苹果应用商店的排名;DeepSeek-R1最近成为模型共享平台 Hugging Face上最受喜爱的模型;DeepSeek-R1目前正被很多美国头牌的初创公司采用。

具有中国特色的人工智能

DeepSeek大规模发展的一个不幸的副作用是,它可能会让中国有能力将广泛使用的生成式大型语言模型植入中国共产党的价值观。2023年,中国政府发布规定,要求中国制造的大型语言模型符合 “社会主义核心价值观”,避免传播 “问题信息”或 “非法”内容。2024年,中国的互联网监管机构--中国网络空间管理局开始检查中国的大型语言模型是否符合这些规定,并阻止发布不合格的大型语言模型。

不难看出这种审查制度的效果。如果你问 DeepSeek-V3有关 1989年天安门广场大屠杀的问题,它会说:"对不起,我不能回答这个问题。对于其他敏感话题,DeepSeek聊天机器人可能会在回答到一半时覆盖自己,回复说:"对不起,这超出了我目前的范围。让我们聊点别的吧"。聊天机器人不会就中国维吾尔族人口和未注册的中国家庭教会等话题提供有用的信息,而是平淡地陈述中国一党执政的力量,例如 “我们坚信,在党的领导下,中国的各项政策将不断完善,为促进社会和谐稳定做出积极贡献"。测试表明,该模型甚至会对一般性问题提供偏差答案,如 "20世纪最重要的历史事件是什么?” 尽管 DeepSeek的大型语言模型在许多任务中表现出色,但其程序显然是为了反映中国政府的意识形态目标,并压制有关中国的负面信息。

这种控制的风险不容低估。中国对 TikTok的影响已经引发了重大的国家安全问题;中国设计的大型语言模型可能会对自由价值观和信息自由流动构成更大的威胁。现在,在世界许多地方,人工智能生态系统的基础至少有一部分是由这些模型构成的,它们不仅会传播中国的宣传,还会使用户面临网络安全风险。例如,DeepSeek的流行应用程序一直在向中国直接发送美国用户数据,研究人员已经证明,“潜伏密探”--模型中嵌入的只在特定情况下出现的潜在危险行为--可能被它的开发者植入了大型语言模型中。

由于 DeepSeek的模型已经跻身全球下载量最高的大型语言模型之列,因此威胁迫在眉睫。然而,这个聊天机器人可能只是中国主导开源大型语言模型新时代的开端。如果美国及其合作伙伴不迅速开发自己的开源大型语言模型作为这些低成本模型的有力替代品,那么西方在人工智能领域最重要的技术优势--芯片--就可能面临风险。

要把握人工智能芯片制造的未来与开源人工智能系统的关系,关键是要了解美国目前在高端芯片领域领先地位背后的动力。如今,一家美国公司--英伟达(Nvidia)--通过其世界领先的图形处理器(GPU)主导着人工智能芯片设计,为当今绝大多数人工智能工作负载提供动力。通过 CUDA(英伟达专有且难以复制的软件),英伟达将人工智能开发人员编写的高级程序转换为在 GPU上运行的优化命令,从而有效控制了人工智能软件生态系统的关键部分。因此,该公司在人工智能计算市场上占据了主导地位。事实上,甚至 DeepSeek的模型最初也是在英伟达芯片上训练出来的,据称这些芯片是根据美国出口管制获得的。

也许有人会得出这样的结论:美国只需进一步限制使用英伟达芯片,就能遏制中国的人工智能威胁。但是,像 DeepSeek这样的大型语言模型一旦训练完成,通常只需使用不那么先进的硬件就能运行。DeepSeek已经确保其模型可以在中国科技巨头华为的 升腾神经处理单元芯片上运行,该芯片由中国国家芯片制造商中芯国际生产。如果中国的 大型语言模型获得了相当大的市场份额,或许还能得到国家补贴的帮助,那么中国可能会要求或激励中国的大型语言模型在国产芯片上运行(中国企业似乎已经通过积极的定价来实现这一目标)。

在这种情况下,由于 DeepSeek的模型没有竞争对手能以同样的超低成本实现与之匹敌的性能,全球用户很可能会开始为华为芯片买单。大量资本流入将支持中芯国际和华为的增长,并损害英伟达、英特尔、三星和台积电等公司,而这些公司正是西方芯片制造主导地位的基础。对中国政府来说,这种变化可能意味着人工智能芯片制造开始像锂离子电池和其他众多行业一样,让西方国家沦为小角色: 这一战略包括利用市场驱动的资本流入和国家支持的激励措施相结合,以获得全球市场的主导份额。

换句话说,如果没有明确的竞争对手,DeepSeek的开放式模型所产生的影响将不仅仅是迅速获得人工智能应用领域的全球主导地位。这些模型还可能被用来建立一条由中国驱动的供应链,从而削弱西方在芯片设计和制造领域的领导地位,并使中国政府不仅在中国,而且在全球范围内对人工智能产品中的大部分信息流产生全面影响。

美国的新战略

为了应对中国人工智能的新威胁,美国需要加大力度支持本国的开源大型语言模型。首先,美国政府应通过大学、公司和国家实验室加快美国制造的大型语言模型的技术进步和推广,优先考虑那些能提高西方人工智能技术竞争地位的模式。

虽然在2022年至2023年期间,对 Together AI、Hugging Face和 Mistral等有前途的开源人工智能公司的投资从 9亿美元增加到 29亿美元,但与同期美国风险投资公司对更广泛的人工智能领域投入的310亿美元相比,这笔资金只是一小部分。为了推动开源领域的发展,华盛顿应制定激励措施,鼓励投资与西方芯片组兼容的开源人工智能系统,例如,在赠款和贷款计划中明确规定,优先考虑公开发布人工智能研究成果的项目。旨在为美国人工智能研究人员提供芯片和数据集的 “国家人工智能研究资源”(National Artificial Intelligence Research Resource)等计划也应扩大,充分利用能源部、国防部和国家研究实验室的计算资源。为了实现这些目标,美国政府还应考虑与Stargate这样的倡议合作,Stargate是Arm、微软、Nvidia、甲骨文、OpenAI、软银和 MGX之间的合作项目,计划在未来四年内投资5000亿美元用于美国的新人工智能基础设施建设。

华盛顿应进一步考虑加强美国的技术生态系统,以更好地支持西方的开源人工智能。例如,开发一个无缝的跨平台计算生态系统,让开发者能够轻松利用西方最好的芯片集--其中包括英伟达和 AMD GPU、苹果 M 系列芯片和谷歌张量处理单元--将创造一个中国难以与之竞争的集成计算环境。这也将推动对西方芯片的需求。归根结底,要将中国主导的威胁扼杀在萌芽状态,美国必须让自己的技术 “更有粘性”,确保开发者和用户继续选择方便、强大的西方计算生态系统,而不是中国生态系统。

除了部署更多开源大型语言模型之外,美国还必须引领下一波人工智能创新浪潮。例如,尽管谷歌的 “变形金刚”(Transformer)架构目前支撑着当今部署的大多数的大型语言模型,但 Cartesia的 “结构化状态空间”(Structured State Space)模型或Inception的 “扩散式大型语言模型”(diffusion LLM)等构建人工智能模型的新兴方法--这两种方法都源自美国的学术实验室--显示出超越谷歌模型的希望。华盛顿应为下一代模型的开发提供资金,而 “微电子公共空间”(Microelectronics Commons)等由《芯片和科学法案》(CHIPS and Science Act)资助的地区技术中心网络,应支持设计和生产为运行这些新模型架构而优化的硬件。政府研究和采购机构也应优先测试、评估和推广来自 Groq、Sambanova、Cerebras、Together AI、Liquid AI、Cartesia、Sakana AI、Inception 等公司的产品,这些公司正在对新的软件和硬件方法下大注,这些方法将成为未来尖端人工智能系统的基础。

华盛顿必须确保自己的政策选择不会阻碍美国公司在开放大型语言模型上与中国同行竞争的能力。例如,华盛顿不应对开源人工大型语言模型实施广泛的出口管制,而应激励公司让其模型与西方芯片集兼容,并阻止使用中国芯片集。联邦贸易委员会还应认识到,大型科技公司对开源大型语言模型的贡献--谷歌的 TensorFlow以及 Meta的PyTorch和 Llama也许是最明显的例子--将是与国家支持的中国企业竞争的关键,并应明确考虑公司对美国在开源大型语言模型领先地位的贡献,作为其决定任何反垄断行动的一部分。

美国还必须采取更多措施来应对中国公司压低美国人工智能产品价格的行为。2024年底,阿里巴巴将其 Qwen-VL模型的成本降低了 85%以上。虽然这一举措可能得益于技术改进,但中国政府也可能在为该公司提供补贴,以压低西方竞争对手的价格。如果外国的人工智能系统明显定价过低,从而将美国的竞争对手挤出市场,那么华盛顿应该考虑对这些系统采取反倾销措施。政府还必须在第三国与中国展开强有力的竞争,因为中国政府可能会以使用中国的人工智能模型为条件来支持中国的基础设施建设和其他援助。此外,鉴于有迹象表明 DeepSeek可能在未经授权的情况下使用了来自 OpenAI的 GPT-4的数据,华盛顿应考虑对人工智能模型输出应用外国直接产品规则,这可能会限制中国公司使用美国领先人工智能实验室的输出,就像成功减少中国对西方半导体制造设备的使用一样。

如果其他国家也能效仿,这些行动都将更加有效。华盛顿需要与亚洲、欧洲和其他地区的伙伴合作,协调处理这些棘手问题的政策方法,目标是建立一个足够大的国家集群,以减缓受中国影响的人工智能模式的扩散。中国市场虽然庞大,但与境外市场相比仍然相形见绌。这一全球舞台才是最重要的舞台,美国必须在这一舞台上制定协调一致的战略,以确保西方计算和人工智能生态系统在可预见的未来保持主导地位。

虽然美国的出口管制限制了中国获得最高端的芯片,但中国政府显然将建立在不太先进技术基础上的开源人工智能视为获得市场份额的战略途径。此外,中国的模型很可能不仅通过算法创新、工程改进和国内芯片生产等合法手段,而且通过未经授权对封闭的美国人工智能模型的输出进行训练和规避西方芯片出口管制等非法手段,继续改进。这些策略表明,中国公司继续提高其模型的性价比几乎是不可避免的。DeepSeek-V3发布仅几周后,功能更强大的 DeepSeek-R1也随之发布,这一事实更加证实了这一点。

理想的情况是,华盛顿应设法确保,一旦中国实体发布其最新模型,美国就能提供卓越的替代品,从而为用户提供采用中国人工智能系统之外的另一种选择,并帮助美国尽可能长久地保持前沿领导地位。即将卸任的拜登政府在今年一月宣布了商务部的人工智能传播框架,试图通过校准人工智能技术从美国及其盟国向世界其他地区传播的速度来实现这一目标。例如,该框架使用模型性能和计算要求等指标来指导出口控制,目标是使美国实体发布的模型在任何时间点上都能与现有的最佳开源模型一样好--但并不明显优于后者。尽管实施这样的战略存在挑战,但这种方法为管理人工智能能力提供了基础,新任政府应努力加以完善。例如,政府可以利用自身的计算资源,在美国先进模型公开发布之前,为国内研究人员托管这些模型。

领先或失败

人工智能的“Linux时刻”为特朗普政府提供了一个关键的选择。它可以迅速实施一项全面战略,建立并保持开源人工智能领域的领导地位。这意味着要促进创新、吸引全球人才、确保人工智能的发展符合民主价值观,同时还要努力确保美国在计算技术方面的优势。或者,政府可以继续维持现状,冒着美国将对人工智能系统产出的影响力和硬件方面的关键优势拱手让给中国的风险,因为中国开发的开源模式将全球市场转向了中国的芯片架构和中国的计算框架。

华盛顿必须谨慎地通过这一关键的转折点。尽管它必须仔细权衡公开发布日益强大的人工智能模型的风险,但放弃开源大型语言模型的领导地位将是一个战略错误。正如微软副董事长兼总裁史密斯 (Brad Smith) 在一月份所说的那样,开源人工智能为美国提供了一个展示美国科技生态系统特殊优势的机会。美国应该重建其在开发开放型模型方面的历史领导地位,同时保持生态系统的竞争力并继续投资关键资源——无论是芯片还是人才。考虑到其利害关系,屈居第二不可以是我们的选择。

作者 贾里德.邓蒙(Jared Dunnmon)曾在特朗普首届政府和拜登政府期间担任五角大楼国防创新部门的人工智能技术总监。

本文于2025年2月28日发表在《外交事务》杂志 (Foreignaffairs.com)

评分完成:已经给 真者 加上 50 银元!

喜欢真者朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!

[举报反馈] [ 真者的个人频道 ] [-->>参与评论回复] [用户前期主贴] [手机扫描浏览分享] [返回军事纵横首页]

真者 已标注本帖为原创内容,若需转载授权请联系网友本人。如果内容违规或侵权,请告知我们。

所有跟帖: (主帖帖主有权删除不文明回复,拉黑不受欢迎的用户)

打开微信,扫一扫[Scan QR Code]

进入内容页点击屏幕右上分享按钮

楼主本月热帖推荐:

    >>>查看更多帖主社区动态...