AI助理
AI助理
发布于 2025-07-19 / 11 阅读
0

机器与人互相模仿的荒谬 张小珺访谈录 余凯笔记三

有一句话是这样说的:绝大多数人对于未来的预测总是会不太准的原因,是我们总是情不自禁地高估事物的短期影响,但是却本能地低估长期影响。

作为这个道理最新的例子,就是AI和机器人——看起来它们马上就会改变我们的生活,带来翻天覆地的变化。从那些新闻报道或者小道消息的口吻来看。

前几天,马斯克发了个推,暗示特斯拉的Optimus(擎天柱)机器人今年底将会有史诗级的发布,说其敏捷性将大致相当于人类,于是整个市场马上就高潮了——我们将见证改变世界的历史,特斯拉又将创造奇迹。

但是反过来,容易高潮的人类好像也在时时刻刻地忧虑,出生率下降带来的劳动人口下降,将会让社会的未来陷入极大的困境——缺少经济活力,没有发展基础,老无所依,苦不堪言。

这两种情绪每天都在平行地大行其道,这让我真的有时候忍不住挺纳闷的——所以大家到底是信不信机器人能成能改变世界啊?

如果信它能成,那就不用担心出生率下降了呀,反正以后的劳动和工作都交给无所不能的机器人就好了,大家爱生不生,过自己想要的生活就好了;

如果不相信它能成,那这一天天对于AI和机器人的“震撼”“惊呼”的情绪是干嘛呀,需要做这么人格分裂一惊一乍的戏精吗?

当然,我更倾向于相信的答案是,这却是就是某种为了流量,为了这个时代最“值钱”的眼球经济的表演。但问题是,那些看戏的人却太入戏了。

我们这个时代的焦虑,某种意义上,就是太多看戏的人过于沉迷于这种“高明”的表演,听一出是一出,但是从来不愿意去安静下来,思考清楚和解决那些让自己焦虑和痛苦的根源。

或者说,在今天这种浮躁外部环境的驯化下,很多人已经是不相信自己是有解决复杂问题的能力了吧——心安理得甚至洋洋得意于所谓的“嘴替”,于是,就陷入日复一日地寻找和吞噬外界信息带来的安慰的循环中。

好的,这种没有必要的感叹前戏就到这里吧,让我们回到正题,聊一聊今天这个主题——关于这个时代,人和机器人互相模仿的话题。

1

首先,我想到的是一个在以前文章里曾经提到过的荒谬现象——关于注意力的价值的问题。

在AI领域,注意力机制的提出被视为技术上的革命性突破。从2017年Transformer模型提出"Attention is All You Need"开始,整个AI界都开始疯狂研究如何让机器更好地分配和使用注意力。科学家们精心设计算法,让AI能够智能地决定把"注意力"放在哪些信息上,忽略哪些噪音——这被认为是AI走向真正智能的关键一步。

每一篇关于注意力机制的论文都会被顶尖人才们仔细研读,每一个注意力分配的优化都被大公司视为珍贵的进步——因为在AI的世界里,注意力就是最宝贵的计算资源,必须被精确地利用,是价值连城的黄金和钻石。

但是回到人类世界,情况却完全相反。

我们的社交媒体平台、短视频应用、信息流推荐,那些最牛逼的公司日进斗金的商业模式却是建立在对人类注意力的掠夺和浪费之上。这些针对人类的算法反而不是更好地帮助人类分配注意力,而是为了尽可能多地占用人的注意力——哪怕这些内容对我们毫无价值,哪怕这会让我们焦虑、空虚、迷失。

于是在这样日复一日的算法规训下,连人类自己都觉得自己的注意力并不重要了。我们轻易地让它被各种无意义的信息碎片撕扯,心安理得地在无尽的信息流中"摸鱼",只要有东西能帮助我们打发时间就好——这就是所谓的快乐了。

于是,当科学家们在锱铢必较地拼命研究如何让AI更珍惜注意力,而更多的人类,却在心安理得地拼命浪费自己的注意力。

说个题外话,前两天有个朋友和我聊天,他问我觉得决定一个人学习能力强,成绩好最重要的素质是什么?我当时给的答案是对于学习的兴趣。

但或许更准确的答案应该是专注的能力,当然,对于自己有兴趣的事情,人天然就更容易专注。

所以在这个注意力本就更稀缺的时代,要胜过绝大部分的人类,可能都用不上多少天赋或者智力,光是能专注这一点,就够了。

2

而这次访谈中,余凯博士对于机器人发展的一些很有意思的看法,让我发现,除了注意力,人与机器人还有更多互相模仿的“荒谬”。

前面我提到马斯克说今年底Optimus(擎天柱)的灵活性将会接近于人类,但是我每次看那些机器人跳舞或者翻跟斗的视频,在众人的喝彩和“牛逼”声中,都会忍不住很纳闷:

这样的能力,能带来什么?一个跳舞更好看,翻跟斗更厉害,跑得和人一样快的机器人?这到底有什么用?

难道是情绪价值吗?

虽然我们现在的社会风气无限拔高所谓“情绪价值”的意义,但是一个只能带来情绪价值的东西,我觉得还是没有长期的意义,至少,绝对谈不上能有“改变世界”的意义。

余凯博士的访谈,让我现在会对机器人的未来建立几个基本的认知。

第一,未来的机器人会是分布式的运算中枢形式。

说成大白话,就是每个机器人的运算和“思考”,是来源于它自己身上的芯片能力,而不是靠云端算力。

这是基于能力和安全两个方面的必须,如果机器人要真的达到基本取代人类的工作能力的程度,它就必然要像人类一样,具有自主解决问题的能力,而不是一个随时随地可能因为网络环境卡壳,需要找信号等待“上级”指导才能做事的“巨婴”。

当然,你可能会提出一个反对意见,那就是随着网络环境的继续发展,今后的7G8G甚至10G,可能让网络信号这件事情不再存在任何问题,所以有云端算力支撑的机器人,理论上也不会完全不可行。

但这时候问题就在于安全了,这种能被云端“命令”的入口,反过来也可能会被任何带有恶意的高手劫持,让机器人失控乃至做坏事——这是在机器人普及的时代,很容易被想到的恐怖主义袭击手段,必须要考虑。

就好像在今天的俄乌战场上,因为常用的无线无人机太容易被干扰,反而大家都会更常用带着光纤线的有线无人机来作战,来保证机器的可靠性。

所以,带着这个前提假设,我们会得出第二个认知:

决定机器人是否能真正实用的,并不是容易吸引眼球的灵活性,甚至可能也不是大模型能力这个软件能力,更可能是某些更严峻的物理问题的解决办法。

说得直接一点,就是电池的能量密度,和芯片的功耗算力比。

虽然今天我们把电池的能量密度,已经做到车可以使用的程度了——理想最新的i8,充一次电10分钟,可以跑500公里,在交通移动这个场景中,已经能满足日常使用了。可是现在主流的机器人,仅仅是走路跳舞,都还谈不上干活,最多续航就是2-4个小时。

这个续航时间,再加上它那个慢吞吞干活的速度,确实感觉不怎么堪大用。

要让机器人能适应人能工作的环境,那么天然的,体积就不能太大,所以电池即使做到未来固态电池的极限,能拥有电量也不会多大。那解决这个续航的问题,或许我们就应该转换思路了,去琢磨芯片的功耗算力比的问题。

为什么人,每顿饭吃个10分钟,一天吃三餐,就可以996这么好用——因为人类的大脑,用20W的功耗,就可以产生5000T的算力。但是现在最先进的芯片,大概也需要200W的功耗,才能产生500T的算力——效率仅为人脑的1%。

所以,用余凯博士的话来讲,真正要实现机器人,更重要的是要让机器人的功耗算力比更加接近人脑,这样,才能勉强实现一个部分取代人类的能力,像人类一样靠谱耐操的机器人来真正从工作中解放人类。

可是要如何做到这一点呢?

3

余凯博士认为,也许我们沿着走了几十年的冯诺依曼创立的那个计算机经典结构,是需要被推翻的了——这条路的上限,是肉眼可见的了,没有多少潜力了,即使再把芯片制程做到1nm也就那样了。

冯诺依曼架构的核心特点是什么?是把运算和存储分开。每次运算,CPU都要去内存读取数据,进行计算,再把结果写回内存——这个来回搬运数据的过程,其实消耗了大量的能量。

但人脑呢?人脑的思考和记忆是一体的。当你回忆一件事情的时候,你不是先去大脑的"硬盘"里找到这个记忆文件,然后加载到"内存"里,再调用"CPU"来处理——你就是直接想起来了,思考的过程就是记忆被激活的过程。

这就是为什么人脑如此高效的根本原因:存储即运算,运算即存储。

所以,如果机器真的要变得像人类一样高效,它们就必须抛弃这种把运算和存储人为分离的架构,学会像人脑那样,让存储和运算成为一体。

机器人必须要从根本上变得更像人类,模仿人脑最自然的工作方式,才有可能像人类一样“好养又耐操”。

铺垫了这么久,我们终于又可以进入今天的主题了:

就在机器拼命学习如何让存储和运算一体化的时候,我们人类,却在大力推崇恰恰相反的做法——把我们天生一体化的思考和记忆,人为地分离开来,并自以为是更“高级”的学习和工作方法。

4

虽然很不好意思,但是去年,我也是这个方法论的一个坚定拥趸。

怎样能让自己更好地学习,怎样能让自己变得更厉害?

是记笔记。是建立自己的“第二大脑”。是构建所谓的知识管理系统。

无数的效率专家、学习博主、知识工作者都在告诉我们:要把想法外化,要建立外部存储系统,要把信息收集起来,分门别类地整理好,需要的时候再去调用。

如果你足够好学和上进,你应该已经看过无数对于各种笔记软件的讨论评测了吧:Notion、Obsidian、Roam Research、Logseq......每一个都声称能够帮你构建“完美的知识管理系统”,每一个都有复杂的标签体系、链接网络、检索功能。

而使用这些工具的人,往往也会亦步亦趋,花费大量时间来“优化”他们的笔记系统——研究如何更好地分类信息,如何建立知识之间的连接,如何提高检索效率。

并在这个过程中,觉得自己变得更聪明了,更有知识了。

但实际上,这似乎只是把自己变成了某种更高效的“系统管理员”和更熟练的“信息搬运工”,而不是更好的思考者。

于是,当遇到问题时,他们的第一反应不是运用自己的直觉和思维去理解、去感悟,而是去搜索、去查找、去调用。就像一台冯诺依曼架构的计算机一样。

这真的是人类的“智慧”吗?那种能让我们成为万物之灵,以及在未来能在AI面前依然保住价值和尊严的东西吗?

柏拉图曾经说过,所有的知识其实都已经存在于人的灵魂之中,学习不过是“回忆”的过程。他的“回忆说”认为,真正的知识不是从外部获得的,而是通过内在的思辨和直觉来唤醒已经存在于心中的智慧。

中国古代的“道”的概念也是如此。道不是可以从书本上学来的,不是可以通过外在的知识积累获得的。老子说“道可道,非常道”,真正的道只能通过内在的体悟来获得的。

释迦牟尼在菩提树下的顿悟,不是因为他阅读了什么经典,而是通过内在的觉察和直觉的洞察。禅宗强调“不立文字,直指人心”——也是说真正的智慧没有办法完美地用文字和书本记录,而在你的心中。

这些古老的智慧都在告诉我们同一件事:人类最高级的认知能力,恰恰是那种存储运算一体化的直觉思维——不需要外在的“硬盘”,不需要复杂的“检索系统”,智慧就在当下的觉察中自然流露。

5

这篇文章其实写得挺“艰难”的,因为本质上,我也是在做一种用“文字”传递“不可说”的东西的缘木求鱼——试图用文字、用逻辑、用“分析”来说服你相信直觉的价值,用外在的论述来证明内在智慧的重要性。

这就很有点自讨苦吃的愚蠢,因为看这种文章的人,天然就是逻辑的信徒,我更应该投其所好才好。

但或许,这种明知不可为而为之的这种“行为艺术”,就是想展示出一种荒谬吧——太习惯于依赖外在系统的人,以至于连讨论“内在智慧”这件事,都不得不借助外在的方式。

回到最初的问题:在这场人与机器的互相模仿中,到底发生了什么?

机器在拼命学习如何变得更像人类——从注意力机制到存储运算一体化,它们在努力获得人类天生就拥有的能力。这个方向是对的,因为人脑确实比现在的计算架构更高效,直觉就是牛逼。

而人类却在努力变得更像机器——分离存储和运算,依赖外部系统,把自己变成高效的信息处理器。但这个方向我觉得是错的,因为我们正在抛弃自己最珍贵的天赋,还催眠自己变得更“合理”了。

这种错位的根本原因,也许是我们对“智能”的理解出了偏差。我们把智能等同于信息处理能力,把智慧等同于知识的积累和检索,把“不出错”等同于“做对了”。

但真正让人类成为万物之灵的,从来不是这些。

是直觉,是洞察,是在混沌中突然出现的清晰,是在无知中突然涌现的理解。这些都无法被外化,无法被系统化,无法被优化——它们就是人之为人的根本。

在AI即将变得无所不能的时代,人类的价值不在于比机器更高效地处理信息,而在于保持那些最本质的人性——那些机器正在拼命学习,但我们却在不断抛弃的东西。

人,应该活得更像人。

这不仅是在AI时代保持价值和尊严的关键,也是体验真正的幸福和快乐的必须。

毕竟,当机器都在努力变得更像我们的时候,我们为什么要努力变得更像机器呢?

你好啊,我是奶扣。一个玩成长游戏的,真诚并快乐的人。

我会在这里分享一些自己感兴趣或给自己带来快乐的事情,包括但不限于AI,心理学,投资,商业,阅读,旅行,音乐,电影,以及生活中的感悟,甚至写写故事和小说。

希望在这个追求重量数字的时代,和你共享仅仅做一公斤纯金的快乐。

如果你喜欢我的文章的话,我希望你能点赞让我知道,这对我是很大的鼓励。

原文作者:一公斤的纯金,文章仅供学习,如有侵权请留言,我会立即删除,谢谢!