We look at the present through a rear-view mirror. We march backwards into the future. (我们透过后视镜看当下,倒退着走向未来) —— Marshall McLuhan(马歇尔·麦克卢汉)

无马的马车

1886年,卡尔·本茨造出了世界上第一辆内燃机汽车。人们给它起了个名字:horseless carriage —— 无马的马车。1913年,吉德昂·逊德巴克发明现代形式的拉链时,为其取的名字是:hookless hooker.

除了造成一些令人哭笑不得的双关之外,这些命名方式本身也很有意思,他们精确地展现了人类面对新事物时的第一反应:在真正理解新事物前,要先借助旧的框架。汽车不是汽车,而是一辆去掉了马的马车。拉链是一种没有钩子,但是还能把衣服钩到一起的东西。

早期汽车的设计也忠实地体现了这种思维 —— 造型模仿马车,保留马车夫的座位和放置马鞭的位置;速度被限制在马匹的速度范围内,因为人们觉得超过这个速度“不对劲”;部分地方立法要求汽车前面必须有人举着红旗步行引导开路,用管理马车的方式管理汽车。我甚至还在维基百科的“Horseless carriage”词条页面上,看到一个1899年的专利图,发明内容是一种叫Horsey Horseless的汽车 —— 在车前面放一个假的马头(同时是个油箱),目的是让汽车不要吓到其他的马。

Horsey Horseless,我愿称之为“拟马车”😂

人们花了几十年才逐渐意识到,汽车不应该是一种“没有马的马车”,而是一种全新的东西。后来的事情我们都知道了,电力和内燃机的发明和应用让人类开启了第二次工业革命,汽车也深度塑造了我们现代生活的形态。城市的规模和格局、交通网络体系、人们的活动半径、商品运输和流通范围,甚至文化的传播、战争的打法,都被汽车深度重塑了。但这一切,在最初那个“无马的马车”上,看不到任何影子。

McLuhan把这种现象叫做“通过后视镜看现在” —— 我们就像是车头向后、挂着倒挡驶向未来。眼里盯着的尽是过去的景象,后视镜里反射的是即将成为过去的现在。未来在我们身后,以我们无法预见的速度“迎面而来”。

我们依赖隐喻理解世界

正如我们在日常的方案探讨、汇报、idea pitch中体会到的那样,一件事情想要给别人讲清楚,基本上不可能不使用类比。讲系统建设,类比成盖房子:先做好架构设计,这是房子的图纸;做好系统基建,这是房子的地基;接口设计,这是水电管线;UI/UX,这是精装修… 没有这样的类比,抽象概念很难被人理解。

乔治·莱考夫‌(George Lakoff)与马克·约翰逊‌(Mark Johnson)在《我们赖以生存的隐喻》( Metaphors We Live By )里做了一个重要的论证:人类的抽象思维几乎全部建立在隐喻之上。我们通过“已知”、“具体”的概念来理解“未知”、“抽象”的概念。隐喻并不只是我们修饰语言的一种手法,而是我们构建概念本身的方式。

“时间就是金钱” —— 我们“花”时间、“投资”时间、“浪费”时间,用交易的概念理解时间。“人生是一段旅程” —— 于是我们说一个人“路走窄了”、“迷失了方向”、“到达了人生的十字路口”,用空间移动的方式类比人生这种抽象概念。

当一个全新的事物出现在我们眼前时,我们在认知层面上没有别的选择,只能用已有概念来套。大脑不支持“直接从零开始理解”这种操作。每一个新事物都必须锚定在旧事物上才能够被理解和接受。

所以“后视镜”现象出现的原因是思维方式本身。承认绝大部分人并不能理解未来这一点,是避免两种幼稚立场的前提 —— 一种是“大家都太保守了而我已在拥抱未来”的居高临下,另一种是“我跟不上时代了”的妄自菲薄。

旧瓶装新酒

既然人的认知结构天然依赖既有框架,那么可以得出一个推论就是:新事物想要被接受,就必须伪装成某种旧事物的“改良版本”。直接搞一个“破坏性创新”的,通常都死的很惨。

电影最初叫“moving pictures”,就是把摄像机架在固定位置忠实记录一出舞台剧;如果一开始就有天才导演直接端出蒙太奇和非线性叙事,观众大概率无法接受。网站的隐喻是杂志书籍,计算机操作界面的隐喻是书桌表面。

而人们对隐喻的“选择”本身也在塑造新事物的发展路径。PDA的隐喻是“口袋里的电脑”。从功能上看,今天的智能手机完全覆盖了PDA能做的一切,你完全可以说手机是能打电话的PDA,但智能手机并不是沿着PDA的路径发展起来的。而是从电话 → 移动电话(手机) → 能发邮件的手机 → 能浏览网页的手机 → 能装应用的手机… “手机”是这类设备最能被接受的隐喻 —— 人人都需要打电话,在手机上支持发邮件听起来远比把笨重的电脑缩小成手持的大小更可实现。iPhone是Smart phone而不是iPod with a SIM Card。

Apple Newton

旧隐喻从来不会在第一时间被识别为隐喻。现如今各类系统界面、APP交互的设计已经严重趋同,或许说明这些方案本身就是移动互联网这一媒介下的最优解,但我们仍然是从“拟物”风格开始,花了很多年才到到达这个结果。人们往往倾向于把隐喻当成对事物的正确理解,直到未来一点点到来,才被逐渐修正。这个过程往往需要通过一代人的退场和新一代人的成长来完成 —— 前一代人用隐喻来理解的事物,对新一代人来说是用来理解新事物的隐喻本身。

顺着这个逻辑来说,或许真正的“适老化改造”应该把老年人熟悉的“旧瓶”找回来,以便他们更好的品尝“新酒”。

AI时代的后视镜

我们当然是在通过后视镜看AI。LLM底层是概率性文本生成,但它进入大众视野的形态是什么?

—— 一个聊天框。

聊天,是所有人都熟悉的模式。我们不需要理解Transformer架构、也不用知道什么叫Token,甚至不用知道什么是“幻觉”。我只需要知道谈话的对方可能胡说八道就行了。实际上,用小字在聊天框下面标注“XX是一款AI工具,其回答未必准确无误”甚至是我认为AI和IM软件在交互设计上最重要的区别。

这也意味着,如果你只是在用ChatGPT“聊天”,你看到的大概率只是它伪装成旧事物的那个外壳,而不是它的本来面目。同样地,即使是建Agent、搭工作流,也仍然是在用我们这一代人最能接受的隐喻去类比一个尚未被真正理解的东西。甚至可以说只可能有极少数人真正“理解”AI。我们都只是在用不同的旧框架去触摸它的一角。

有个让我感触很深的小例子。前段时间看到了一个从来没想到过的用法:拍一张快递架的照片,让AI识别特定取件码的位置。我习惯了“聊天”和“搜索”的隐喻,认为AI是一个“你问他答”的东西,却从没想过在需要视觉识别和空间定位的场景的使用。

类似的还有很多。比如,AI看起来像一面镜子,它大概率在你指定的框架内回答问题。如果你问了一个预设结论的问题,它顺着你预设结论走的概率更高,而且几乎不会突然展开“联想”并调整谈话的走向。我觉得这并不完全是厂商把AI调教成“讨好型人格”的结果,而是因为你的输入本身就塑造了它的输出分布。如果你把使用AI看成跟人讨论问题,你会以为它像有独立判断一样在回答你,但如果是站在未来回看现在,你就能明显的发现这就是一种隐喻 —— 用人隐喻AI。

有一个容易被忽视的对称性是:后视镜不只让人低估AI,也让人高估AI。历史上这种高估也反复上演 —— 1950年代人们以为核能会驱动家用吸尘器,1960年代人们觉得2000年前人人都会有飞行汽车,2000年代人们认为互联网的发展会让大部分人完全远程工作。人们倾向于在旧框架里对新技术做简单的线性外推,然后得出极度乐观或极度悲观的结论。今天的AI hype也一样:我们把AI理解为“可以说话思考的人”,然后推导出“AI即将低成本替代大部分人工作”的结论。但AI能力发展的轨迹很可能跟人类智能的轨迹完全不同 —— 在某些方向上无限延伸,在另一些方向上遇到根本性的瓶颈。恐惧派认为AI会取代人,因为AI通上电就能“思考”而有些人吃多少饭都不肯思考;乐观派认为AI永远不够格,因为它只是鹦鹉学舌、没有灵魂。

怎么办?

如果后视镜思维是人类认知的结构性限制,那“正确的应对方式”是什么?这个问题我也没有答案。我不会简单的说:停止使用隐喻。那是不可能的。我会尝试做以下三件事情:

第一,意识到隐喻的存在。 我们对隐喻的使用无处不在,不特别留意很难发现。仅仅是注意到“我正在使用一个类比”这件事本身,已经可以算作一个认知进步了。

第二,检验隐喻的边界。 每个隐喻都有有效范围和适用边界。房子搭好就很难再改了,但软件系统可以不断更新迭代,这就是用房子隐喻软件系统的边界。主动去寻找隐喻崩溃的地方,能够帮我们理解新事物到底“新”在哪里。

第三,使用尽可能多的隐喻。 没有任何一个单一隐喻能覆盖事物的全貌。最好的理解方式,不是找到那个“对”的类比,而是尝试多种可能,用不同的边界逼近一个更精确的轮廓。

后视镜里的未来

We look at the present through a rear-view mirror. We march backwards into the future.

McLuhan这句话本身就是一个极其精妙的隐喻。我们在阅读这句话的过程中,就在经历它所描述的现象。我们通过 rear-view mirrormarch backwards 这两个熟悉的画面,来尝试理解一个关于人类对未来认知局限性的抽象论断。但这一隐喻暗示了未来是一条线性的道路,也同样暗示了我们可以“转过身来”面对未来。这些都不一定是真的。

这篇文章的写作一样依赖使用隐喻。这个问题的困难之处、也是它的迷人之处在于:我们无法跳出语言来谈论语言的局限,无法不用隐喻来描述隐喻的边界。谈论“后视镜里的未来”也不是要找到一个理解未来的完美视角(这不存在),而是为了意识到自己正站在过去的延长线上向前看。

100年之后的人回看我们对AI的理解,会看到什么?大概会看到一群人围着一个全新的东西,认真的讨论它怎么能更像人、怎么能替代人工作、被替代的人去做什么… 就像1899年的Uriah Smith,认认真真地思考汽车如何与马车共用道路、更容易被接受,然后在汽车前面安了一个马头。