何帆：为什么伟大的目标反而会误导你 -6parkbbs.com

今天来读一本书，书名是：《为什么伟大不能被计划》。这本书最近很火爆，跟两位作者的身份有关。肯尼斯·斯坦利（Kenneth Stanley）和乔尔·雷曼（Joel Lehman）都是人工智能专家，都有在OpenAI的工作经验。

对，OpenAI就是研发出ChatGPT的那家公司。ChatGPT是一个令人激动的革命性技术创新。蒸汽机的出现标志着工业革命的到来，而ChatGPT则标志着人工智能革命的到来。在技术演进的历史中，ChatGPT有着和蒸汽机一样的里程碑意义。更有意思的是，这项技术创新更多的是源自研发人员的兴趣，而非对商业利益的追逐。这项技术创新是由一群游侠，而不是正规军和大部队实现的。在这个过程中，OpenAI的团队摸索出了一套独特的方法论。本书就是基于两位作者在研究AI算法中的一项创新而获得的顿悟，从中推演出了一套新的实践指南。

这是一个颠覆性的建议。

常规的打法总是在约束条件下求目标函数最大化。也就是说，想要取得成就，总要先有目标，然后，行动方案就要围绕着这个目标而定。本书的观点是：目标会误导你。越是伟大的目标越容易有误导性。没有目标比有目标更容易实现目标。

为什么会是这样呢？我们先讲个故事，看看从中能有什么启发。

假设有两个探索队。一支探险队有着明确的目标，他们要到山的另外一侧，比如说山的北面，去寻找传说中的金矿。因为目标明确，他们就会尝试用各种不同的办法越过这座山。一条路不通，再退回来找另外的路。每一次，他们都会先看看指南针，确定好方向，坚定地朝北走。

另一支探险队更像出门旅游。他们一边走一边欣赏风景。他们会在湖边露营，用地质锤敲打路上遇见的岩石。他们会对河流的方向、风的方向感兴趣。看到一条路，他们可能就会顺着这条路走，哪怕这条路是朝南走的，因为他们总想看看这条路到底通向何方。

最终会有收获的可能未必是第一支探险队，而是第二支探险队。或许，越过山峰的路可能是要先朝南走，再朝东走，迂回包抄。也可能，第二支探险队会在南边找到了更大的金矿。又或许，他们出发的时候是想找金矿，最后找到了一处石油矿。又或者，他们找到了一处美丽的风景，找到了“优胜美地”，可以做国家公园。

这当然只是个假想的故事。不过，人工智能科学家在实验室里做过相似的实验。他们把机器人放进迷宫，让机器人在迷宫中摸索。一种指令是目标导向，告诉机器人必须找到迷宫的出口；另一种指令是新奇性搜索，鼓励机器人在迷宫里瞎转。结果，在重复40次的新奇性搜索迷宫实验中，机器人在39次实验中找到了出口；而在重复40次基于目标的迷宫实验中，机器人只成功了3次。这背后的底层逻辑是啥？

创新就是发现，这是一个随机的探索过程。你不可能预测技术的演进路径。比如，现代内燃机的前身是感应线圈，但其最初不是以制造发动机为目的的。当内燃机刚刚出现的时候，还没有飞机，也不会有人想到要把内燃机应用到飞机上。从感应线圈到内燃机再到飞机，整个创新链条上，每一个环节的发明者都没有想到下一个环节会是啥。

这就意味着，过程比目的更重要，比起到达终点，路上的风景更值得关注。在发现的过程中，我们会遇到很多新奇的现象，这些新奇的现象似乎和最终的目标没有什么关系，其实却是奠定技术创新的垫脚石。没有这些垫脚石，我们就无法往前走。所以，在探索的过程中，应该注意找到更多的垫脚石，这些垫脚石预示着更多的可能性。

伟大的创新不是被计划出来的，而是来自误打误撞。比如说，在研发飞机的过程中，在当时看来最有可能成功的不是莱特兄弟，而是塞缪尔·皮尔庞特·兰利（Samuel
Pierpont
Langley）。兰利一度获得了大量的政府资助，莱特兄弟却只能自筹资金，而且钱少得可怜。那为什么莱特兄弟会成功呢？原因出乎意料，因为莱特兄弟原来本是自行车制造商。自行车就是通向飞行器的垫脚石。只有身为自行车制造商的莱特兄弟意识到，飞行器就是空中的自行车，于是，机缘巧合，他们才造出了最早能升空的飞机。

这就是垫脚石的妙处，你都不可能知道它们能用来干啥。这也是物种演化的规律。在进化论里，有个现象叫扩展适应，说的是生物曾经使用过某种功能的结构，在进入一个新的环境之后，又被用于另一个不同功能的现象。比如说，羽毛最初是在恐龙身上进化的，主要功能是为了保持体温，后来才逐渐成为适合鸟类飞行的结构。骨骼一开始只是用于储存供身体其它功能所需要的矿物质，后来才进化成为人体的支撑性结构。

这给我们的启发是，要把自己变成一个寻宝者，在积极地追求实现某个特定目标时，我们要做的是尽可能保留多块备选的垫脚石，以确保实现目标的成功率。寻宝者可以说是秉持着机会主义的探险家，他们致力于寻找任何有价值的东西，而不在乎这些东西具体是啥。

你可能会问，这跟人工智能又有什么关系呢？

OpenAI团队曾经建过一个叫图片孵化器的网站。图片网站上的图片就像动物一样能够繁衍出和“父母一代”略有不同的“孩子”。研究人工智能的科学家找到了一种方法，为存储在计算机内部的图片创造了一种人工DNA，然后再将这些图片的基因像动物那样整合在一起。大概是这样一个过程：屏幕上显示出一组图片，比如同时显示10张或20张图片，然后，用户点击自己喜欢的图片。这些图片就成为下一代图片的父母。然后，屏幕上再显示一组新的图片，用户继续点击自己喜欢的图片，以此类推，直到最后用户找到了自己最满意的图片。

实验表明，用户培育出的令他们最满意的图片往往并非他们最初设定的目标。以进化出一张特定图片为目标去繁育图片，其实是一个糟糕的想法。在实验的过程中，你会发现，一张外星人脸的图片，最终会变成汽车的图片。最终的图片很少与作为垫脚石的图片相似。网站上最成功的用户是没有设定目标的那些人。

由此，两位作者提出了一种新的AI算法，叫新奇性搜索。这个算法会随机生成一组解决方案，评估新奇性，保留新奇性比较高的方案，循环往复，直到将问题彻底解决。换言之，这种算法的标准是：只问新不新，不问好不好。

那么，为什么目标会误导我们呢？

因为通向最终目标的道路往往是曲折的，是需要在各个不同的方向上探索的，那就需要给予探索者更多的主动性，而且，要求探索者对新奇事物更为敏感，心态更为开放。一旦想要通过设定目标来完成任务，往往就会带来意想不到的扭曲。

比如，印度受英国殖民统治时期，英国政府为了消灭毒蛇，出台了一项政策：每上交一条死蛇就能领取一笔报酬。但这项措施并没有达到预期的效果，反而导致印度人为了获得赏金争相饲养眼镜蛇，然后杀死他们牟利。最终，毒蛇的数量反而增加了。还有，考古学家为工人发现的每块恐龙骨碎片支付报酬，会导致工人选择砸碎整个骨头获取更多的奖赏；企业为了提高企业收益，给高管支付奖金，会导致带来长期隐患的短期逐利行为。

两位作者指出，目标越是高大上，越容易带来误导。若想实现丰功伟业，目标往往会成为绊脚石。

正确的办法是：扔掉绊脚石，去找垫脚石。

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

手机扫描进入，浏览分享更畅快！

楼主本栏目热帖推荐：

知名苹果记者Mark Gurman评Vision Pro近况，称 04/21/24
你不能相信强国 04/16/24
5.3% 04/16/24
国家统计局🤪🤪 04/15/24
李嘉诚再一次降价卖房。 04/15/24
据塔斯社周末报道，俄罗斯联邦动植物卫生监督局新闻处发布公告称，俄 04/14/24
2024 04 中国对美出口份额 04/14/24
中国货物贸易进出口总值10.17万亿元 04/12/24
【济南万科：肖劲因个人原因配合相关部门调查公司运营正常】 04/11/24
赵建：中国与世界——大背离与再平衡 04/09/24
中国正处于全面通货紧缩之中 04/08/24
揭开小米su7的天灵盖 04/07/24

>>>>查看更多楼主社区动态...