OpenAI 联合创始人 Karpathy 发文：用自动驾驶诠释通用人工智能 AGI

桃子好困 发表于 2024/1/28 12:04:27

OpenAI 联合创始人 Karpathy 发文：用自动驾驶诠释通用人工智能 AGI

你认为的 AGI 是什么样子的？OpenAI 联创、前特斯拉 AI 总监 Karpathy 发文，用自动驾驶诠释 AGI！对于「通用人工智能」，OpenAI 科学家 Karpathy 下场做出了解释。

前几天，Karpathy 在个人 blog 发表了一篇文章「将自动驾驶作为 AGI 的一个案例来研究」。

不知是何原因，他却删除了这篇文章，幸而，还有网络备份。

众所周知，Karpathy 不仅是 OpenAI 的创始成员之一，还曾是特斯拉前 AI 高级总监、自动驾驶 Autopilot 负责人。

他将自动驾驶作为案例，研究 AGI，这篇文章的观点确实值得一看。

自动驾驶

LLM 的爆发引发了众多关于 AGI 降临的时间，甚至它可能是什么样子的讨论。有的人对 AGI 未来充满希望，持有乐观的态度。而有的人却充满恐惧和悲观的情绪。

不幸的是，其中也有很多讨论过于抽象，导致人们的观点互不接轨。因此，我总是在寻找具体的类比和历史先例，用更具体的术语来探讨这个主题。

特别是，当我被问及「你认为 AGI 会是什么样子」时，我个人喜欢用自动驾驶举例。在这篇文章中，我想解释一下原因。让我们从 AGI 的一个常见定义开始：

AGI：一个在大多数有经济价值的工作中超越人类能力的自主系统。

请注意，在这个 AGI 定义中有两个具体要求。

首先，它是一个完全自主的系统，即自己运作，很少或根本没有人类监督。

其次，它在大多数有经济价值的工作上都是自主运作的。关于这部分数据，我个人喜欢参考美国劳工统计局的职业指数。

一个同时具有这两种性质的系统，我们将其称之为 AGI。

我想在这篇文章中建议的是，最近我们自动驾驶能力的发展是一个非常好的早期案例，研究了日益自动化的社会动态，可以拓展到对 AGI 的总体样貌和感受的研究。

我这样认为的原因是，这个领域具有几个特征。可以简单地说「it is a big deal」：自动驾驶对社会来说非常容易理解，更常见。

它在经济规模上占据了很大一部分，并且雇佣了大量的人类劳动力。驾驶是一个足够复杂的问题，但我们已经实现自动化，并引来社会的高度关注。

当然，也还有其他的行业实现了大规模的自动化，但要么是我个人对它们不太熟悉，要么它们在上述一些属性方面有所欠缺。

L2 级自动化

驾驶的自动化被认为是 AI 领域中一个极具挑战的问题，并非一蹴而就。

它是通过逐步将驾驶任务自动化的过程而成的，这个过程中涉及了许多阶段性的「工具型 AI」。

在车辆自动化方面，目前许多汽车已经配备了 L2 级驾驶辅助系统。即一个能与人类司机协作，共同完成从起点到终点旅程的 AI。

虽然它还不能完全自主驾驶，但 L2 已经能处理许多驾驶中的基础任务。有时，它甚至能自动完成整个操作流程，比如自动泊车。

在这一过程中，人类主要扮演监督角色，甚至可以随时接手，直接驾驶或下达高级指令（如换道请求）。

在某些方面（比如保持车道居中和快速决策），AI 的表现甚至超过了人类，但在一些罕见的情况下还是会有所不足。

这与我们在其他行业看到的许多 AI 工具非常相似，特别是随 LLM 最近的技术突破。

例如，作为程序员，当我用 GitHub Copilot 来自动补全一段代码，或使用 GPT-4 编写更复杂的函数时，我实际上是将基础任务交给了自动化系统.

但同样，如有需要，我也可以随时介入进行调整。

换句话说，Copilot 和 GPT-4 就像是在编程领域的「二级」自动化工具。

在整个行业中，有许多类似的「二级」自动化解决方案，但并不是所有的都基于大模型，从 TurboTax，到亚马逊仓库中机器人，再到翻译、写作、艺术、法律、营销等领域的各种「工具型 AI」。

全自动驾驶

随着时间的推移，一些系统的可靠性达到了新高度，变得就像今天的 Waymo 那样。

它们正逐步实现「全自动驾驶」。

如今，在旧金山，你只需打开应用，就能叫到一辆 Waymo 无人驾驶车，它将会来接你，并把你安全送达目的地。

这实在是令人惊叹。你无需懂得驾驶，也无需关注路况，只需舒服地靠后坐，并小憩片刻，系统便会将你从起点带到终点。

与我交谈过的许多人一样，我个人更倾向于选择 Waymo 而非 Uber，我几乎只使用它来进行市内交通。

你会拥有更稳定、可预测的旅程体验，而且驾驶过程平稳，可以听音乐，不用顾及司机在听你说话时在想什么。

「复合经济」

虽然自动驾驶技术已经走入现实，但仍有许多人选择使用 Uber。原因何在？

首先，很多人根本不知道他们可以选择 Waymo 作为出行工具。即便知道，许多人对自动化系统仍缺乏足够的信任，更倾向于由人类司机驾驶。

不过，即使有些人接受自动驾驶，或许他们还是更倾向于人类司机，比如享受与司机的交谈，以及与他人的互动。

不仅仅是个人偏好，从现在应用中不断增长的等待时间可以看出，Waymo 面临着供不应求的问题。市场上的车辆数量远远无法满足需求。

这部分原因可能是，Waymo 在管理和监测风险和舆论方面非常谨慎。

另一方面，据我所知，Waymo 受到监管机构的限制，只能在街道上部署一定数量的车辆。另一个限制因素是，Waymo 不能一夜之间就完全取代 Uber。

他们需要建立基础设施，生产汽车，扩大运营规模。

我个人认为，其他经济领域的自动化也将面临同样的情况 —— 有些人 / 公司会立即采用它们，但许多人（1）不了解这些技术，（2）即便了解，也不会信任它们，（3）即使信任，他们仍然更愿意与人类合作。

但除此之外，需求超过供应，AGI 也将因为同样的原因受到同样的限制，包括开发商的自我约束、监管限制以及资源短缺，比如需要建立更多的 GPU 数据中心。

技术全球化

正如我已经在资源限制中暗示的那样，这种技术的全球化部署成本非常高，还需要耗费大量人力，推广速度也慢。

今天，Waymo 只能在旧金山和凤凰城驾驶，但这种技术本身是通用的，还可以扩展，因此该公司可能很快就会推广到洛杉矶、奥斯汀等地。

自动驾驶汽车还可能会受到其他环境因素的限制，比如在大雪中驾驶。在一些罕见的情况下，它甚至可能需要操作员的救援。

此外，技术能力的扩展还需要很多资源成本，并非是免费的。

比如，Waymo 必须投入资源后才能进入另一个城市，比如绘制街道地图、整体感知路径规划、控制算法以适应某些特殊情况，或当地的法规。

就像我们的工作比喻所示，许多工作可能只在某些特定环境下才能实现自动化，若是扩大范围还需要大量的工作。

无论哪种情况，自动驾驶技术本身都是通用的和可扩展的，其应用前景将随着时间的推移而逐步拓宽。

社会反应：很快成为「过眼云烟」

关于自动驾驶技术逐渐融入社会的过程，我觉得特别有趣的一点是 ——

就在几年前，人们还在热烈讨论并对其充满了疑虑和担忧，争论着它是否能够成功运作，甚至是否可行，这成了一个广泛关注的议题。而现在，自动驾驶不再是未来的梦想，它真的出现了。

它不仅仅是一个研究原型，而是成为了一种可以用金钱购买的完全自动化交通方式。

在目前的应用范围内，自动驾驶技术已经实现了完全的自主性。

然而，总体来看，这似乎并没有引起太多人的关注。我交流过的大多数人（包括科技领域的！）甚至都不知道这一进展。

当你乘坐 Waymo 在旧金山的街道上行驶时，你会发现很多人对它投以好奇的目光。他们首先会感到惊讶，然后好奇地凝视。之后，他们就会继续自己的生活。

当自动驾驶技术在其他行业也实现完全自主时，世界可能并不会因此而动荡不安。

大多数人可能一开始，甚至都没意识到这一变化。当他们注意到时，可能只是好奇地看一眼，然后不以为意，这种反应从否认到接受都有。

有些人可能会因此感到不安，甚至采取一些抗议行动，比如向 Waymo 汽车前放置交通锥这样的举动。

当然，到目前为止，我们距离见证这一现象完全上演还很遥远。但当它发生时，我期望它在很大程度上具有预测性。

经济影响

当我们讨论就业时，不可否认，Waymo 明显地取代了驾驶员的岗位。

但同时，它也催生了许多以前不存在的工作岗位，这些岗位相对不那么显眼 —— 比如为神经网络收集训练数据的标注人员、远程协助遇到问题汽车的客服人员、负责建造和维护车队的工作人员等等。

首先诞生的是一个包含各种传感器和相关基础设施的全新行业，旨在构建这些装备精密的高科技汽车。

正如人们对工作的普遍看法一样，许多岗位都将发生改变，一些岗位会因此消失，但也会出现很多新的岗位。

这其实是工作形态的一种转变，而非简单的岗位减少，尽管岗位减少是最直观的变化。

虽然很难说总体就业人数不会随着时间推移而减少，但这种变化的速度比人们简单预想的要慢得多。

竞争环境

最后，我想谈谈自动驾驶领域的竞争环境。

几年前，自动驾驶汽车公司如雨后春笋般涌现。但今天，随着人们逐渐意识到这项技术的复杂性（我个人认为，基于当前的人工智能和计算技术，实现自动化仍然十分困难），这个领域已经经历了大规模的整合。

其中，Waymo 成为了首个完整展示自动驾驶未来的公司。

尽管如此，还有一些公司仍在紧追不舍，比如 Cruise、Zoox，以及我个人特别喜欢的 Tesla。

这里我要简单提一下，基于我在这个领域的经历和参与。在我看来，自动驾驶行业的终极目标是实现全球范围内的完全自动驾驶。

Waymo 选择了先实现自动驾驶再全球扩展的策略，而 Tesla 则是先全球布局再逐步提升自动驾驶技术。

显然，这两家公司将会面临截然不同的调整：一家主要是软件方面的工作，另一家则是硬件方面的工作。

目前，我对他们的产品都非常满意，个人而言，我更是对技术本身充满了支持。

同样的，很多其他行业也可能经历一个快速增长和扩张的阶段（就像大约在 2015 年的自动驾驶领域），但最终，可能只有少数几家公司在这场竞争中存活下来。

在这个过程中，将会有许多实用的 AI 辅助工具（比如现在的 L2 ADAS 功能）和一些开放平台（比如 Comma）得到广泛应用。

通用人工智能（AGI）

以上就是我对通用人工智能（AGI）未来发展的大致设想。

想象一下，这样的变革将以不同的速度遍布整个经济体，并伴随着许多难以预料的相互影响及连锁反应。

虽然这个设想可能不尽完美，但我认为它是一个值得记住并有益参考的模型。

从模因（memetic）的角度来看，AGI 与那种逃离我们控制、在网络空间自我递归提升、制造致命病原体或纳米机器人、最终把银河系变为灰色粘质的超级智能相去甚远。

相比之下，它更像是自动驾驶技术的发展 —— 一项正在快速推进且能改变社会的自动化技术。其发展速度会在包括受教育的劳动力资源、信息、材料、能源，以及监管等多个方面受到限制。

在这之中，社会既是观察者也是参与者。

世界不会因此崩溃，而是会适应、变化并重新构建。

就自动驾驶本身而言，交通自动化将大大提升安全性，城市将变得更加清新、通畅，而那些占据道路两旁的停车场和停放的汽车将逐渐消失，从而让出更多的空间。

对于通用人工智能（AGI）带来的所有这些可能的变革，我个人是充满期待的。

网友热议

总而言之，Karpathy 将 AGI 看作更像是自动驾驶的发展，这一具体类比的观点，引发了众多网友的讨论。

「看到那个无法交付 FSD 的人，决定将 FSD 与 AGI 进行类比，实际上确实给了我信心，我们还有几十年的时间」。

是啊，他好像忘记了「G」。我记得 Norvig 在几十年前的人工智能著作中曾说过，「智能」并不意味着无所不能，一个智能体要想有用，解决一个小问题就足够了。在我看来，这就是 G 的由来。

而我们现在却突然又回到了以前那个狭隘的定义？我仍然看不到从 LLM 和自动驾驶到 AGI 的路径。

当然，AGI 的发展可能是渐进而缓慢的，就像我们看到 Waymo 打造自动驾驶汽车一样。但这只是众多方式中的一种，你也可以看到 AGI 通过非常不同的方式突然出现，就像通过扩展大规模 LLM 那样。

参考资料：

https://web.archive.org/web/20240122062223/https://karpathy.github.io/2024/01/21/selfdriving-agi/

科学探索 Archiver