《通用人工智能:认知、教育与生存方式的重构》刘嘉 著
责编| 排版| 鹅妹子
第 9018 篇深度好文:5632字 | 15 分钟阅读
古希腊通识教育的核心是培养贵族的政治和文化能力,与普通人的生活需求和社会功能无关;耕种庄稼、蓄养牲畜等与生活相关的工作,则专属于普通公民和奴隶。
在古希伯来文中,“奴隶”和“工作”是同一个词。
在古罗马时期,通识教育的实用性被极大地提升——即使面向贵族的通识教育中的思辨也被极大地削弱,而法律、建筑、雄辩术等实用学科则得到大力发展。
进入现代,工业革命和现代化需要大批受过基础教育的劳动者,以适应新型经济结构和技术发展的需求,于是19世纪普鲁士的义务教育制度成为现代教育的模板,以培养所有社会阶层的工作技能。
在AGI时代,我们在将发端于工业革命时期的专才教育变革为通识教育时,既要继承古希腊通识教育注重广博知识和理性思辨的传统,也要融入现代科学技术和跨学科思维,强调教育实用性与思想性的平衡,并加入全球化与文化多样性的视角。
因此,在我看来,现代的通识教育,我们需要培养这五大能力:
研究:提出正确问题。
统计:探寻万事万物之间的关系。
逻辑:从已知推演未知。
心理:理解自己,洞悉他人。
修辞:说服他人,引领革新。
在AGI时代的五大能力中,“逻辑”与“修辞”来自古希腊的通识教育,“研究”“统计”和“心理”则是近代科学技术进步、人类文明发展的结晶。
一、研究:提出正确问题
管理学家彼得·德鲁克说过:“最严重的错误不是因为错误的答案,而是因为问了错误的问题。”
身处AI时代,当计算机习得了这个世界的规则与论断时,它是否就有了智能?
这就触及一个最根本的问题:智能的本质是什么?
国内很多教育工作者认同:智能的本质是记忆。
这也是为什么从平时的课堂测验到终极高考,都是基于学业知识而不是学业能力的考试——谁能记住最多的知识和公式,谁就能得高分,谁就能考上好大学。
以辛顿为代表的联结主义AI研究者则问了一个完全不同的问题:“如何让计算机模拟人脑的信息处理机制来拥有智能?”
辛顿认为:
现代AI的设计灵感来自对大脑工作方式的理解。
大脑的工作方式是,它由一个由大量脑细胞组成的网络构成,输入会引发神经网络产生一系列活动,最终产生输出。输出的结果取决于脑细胞之间连接的强度。如果改变这些连接强度,就会改变每个输入对应的输出结果。
目前AI的工作方式是,不再直接编程计算机,而是向它展示大量的例子。通过这些例子,它会自行调整连接的强度,从而学会生成正确的答案,而无须我们明确编程。
在这段话里,核心词就是“学会”。也就是说,在联结主义AI的研究者眼中,智能的本质是学习。
所以,人工神经网络的发展历程就是一个如何仿照大脑处理信息机制,不断增强AI的学习能力的过程。
第一个具备自主学习能力的AI,是1958年由心理学家弗兰克·罗森布拉特提出的感知机。
在这个模型中,罗森布拉特通过模拟大脑突触的强化过程,提出了权重的自动调整机制,让人工神经网络不依赖人工设定而自动调整权重以完成学习任务。
知识只是智能的产物,而学习才是智能的原因。
但是,当年辛顿是如何在如日中天的符号主义AI浪潮中另辟蹊径,提出了一个在当时离经叛道但后来被证明无比正确的问题?
我认为,这背后的能力来自辛顿的“研究”能力。在科学研究中,最关键的一步是通过文献综述和批判性思维提出高质量的问题。
文献综述帮助构建全面的知识框架,找到之前研究的盲点,而批判性思维的核心是质疑现有假设、打破传统框架,并通过逻辑推理和系统分析找到问题的本质,从根本上揭示新的研究方向。
有趣的是,我们可以把“研究”能力迁移到其他任何领域,如:
买学区房(文献综述:查看政策文件,了解当地的学区划分政策是否有变动风险;批判性思维:学区房投资回报可能不如多元化教育投入)
看病(文献综述:查阅不同医院在对应科室的专业排名;批判性思维:高水平医院是否倾向于过度治疗)等。
此时,文献综述就是海量阅读,批判性思维的背后则是“平等”心态。
萨姆·奥尔特曼说:“就人的智力而言,未来不会像现在这样重要,AI可以弥补人的智力。在未来,提出正确问题的能力比找到答案的能力更重要。”
所以,要提出正确问题,需要基于阅读和批判的研究能力。
二、统计:探寻万事万物
之间的关系
现在,量化基金已经使用AI和大数据实时分析推特、红迪、新闻网站的情绪,并结合市场数据制定交易策略。
“社交情绪+大数据”的量化交易模式,正在重塑金融市场。
所以,当我们在社交媒体上看到某只股票成为热门话题时,记住,某个量化交易的算法已经在我们之前发现了这个趋势,并正在执行交易。
通过现代技术,我们可以在纷繁复杂、无序的多模态大数据中寻找模式以预测未来;其实古人也有类似的思维范式,作为“群经之首”的《易经》就是他们的“数据分析工具”。
古人的这种思想与现代的大数据有异曲同工之妙,即通过纷繁复杂的数据(变化),发现事物的变化规律(简单),预测未来趋势(恒定)。
进入现代社会,从预测流行病的传播路径到金融市场的动态演变,再到社交网络上的情绪扩散,对大数据的统计已经成为我们探索世界运行方式的关键方法。
更重要的是,统计不仅仅是一个预测未来的“工具”,它正在深刻地影响我们理解世界的方式,甚至塑造人工智能的未来。
另外,因为互联网的出现而万物互联,使得数据也发生了本质上的变化。
简言之,大数据具有4个主要特征特性(简称4V):海量(Volume)、流速快(Velocity)、多模态(Variety)、真实(Veracity)。
大数据的4V特性决定了大数据人才不是那些掌握了分布式计算、流式数据处理与数据可视化等技能的人,而是具备了数据思维的人。
数据思维不同于传统的数据分析或数据科学,是一种更高层次的认知方式,即如何通过数据看清事实、揭示规律、优化行动。
它的核心理念包括以下四点:
其一,数据驱动决策,即用数据而不是直觉做决定。
例如,星巴克在全球开店时,不是凭经验选址,而是分析人流数据、消费水平、竞争情况,精准预测门店盈利能力。
例如,全球最大的在线支付平台之一PayPal,通过对正常交易模式的异常点检测,成功降低70%以上的欺诈交易损失,同时减少50%的误报率。
其三,因果推理,即理解数据之间的因果关系,而不仅仅是相关性。
最好的例子就是幸存者偏差效应,即人们只关注那些“幸存”或成功的事物,而忽略了那些失败或消失的,从而导致判断偏差。
其四,数据价值最大化,即从数据中挖掘价值,创造竞争优势。
例如,网飞通过数据分析,发现观看政治剧的人群,同时喜欢凯文·史派西和戴维·芬奇的电影。
三、逻辑:从已知推演未知
想象一下,在远古时代,我们的祖先智人有一天运气不错,猎到了很多动物。肉吃不完,于是他想留到第二天再吃。
现在摆在这个智人面前的问题,是如何保留好这些肉防止蚂蚁或老鼠偷吃。
这个智人灵光一现,想起了在打猎路上看见的悬挂在树枝上的水果,于是便有了解决方案:
把肉用绳子穿起来,挂在岩壁之上,这样蚂蚁和老鼠就够不到了,于是肉就能保留下来。
通过观察自然现象,然后总结规律,再应用到另外一个场景,这就是归纳推理,也被称为“统计学习”或“联想学习”。
这种学习能力并非人类所特有,在其他动物身上也很常见。
智人之所以能跳出大自然的食物链,成为万物之灵,并非因为他们学会了归纳推理,而是因为他们把上述通过归纳推理得到的知识总结成了“IF-AND-THEN”的形式。
IF:如果物体上打一个洞,用绳子穿过洞,就可以挂起来了。
AND:我现在有肉,有绳子。
THEN:于是肉就可以挂在空中了。
乍一看,这无疑是画蛇添足,把一个简单的生活常识变得晦涩复杂。
但是,正是这样的形式化表达给智人的生活带来了根本性改变,让人类从环境的产物变成了环境的营造者,开始按照自己的想法改造世界。
亚里士多德把这三段论称为演绎推理,并把IF的内容称为“第一性原理”,即世界上的一切事物都可以通过逻辑和推理回溯到最基本的原则或原因,然后从第一性原理出发,实现颠覆性创新。
从智人原始的“IF-AND-THEN”的思维模式到今天0和1无所不在的AGI时代,作为一种全新思维模式的演绎推理,使得人类区别于动物。
显然,相比学习数学运算(如偏微分方程)或物理规则(如量子计算),掌握第一性原理和演绎推理的思维模式更为重要。
遗憾的是,在基于知识的教育体系中,我们总是训练学生在看到一个问题后直接进行计算或推理,以便立刻得到答案。
这种从问题到答案的直线思考方式的缺陷是,容易局限在现有知识框架内,掉入"局部最优"的陷阱。
从第一性原理出发的演绎推理的思维模式,需要有意识地训练U型思考。
U型思考的核心在于:不直接寻找答案,而是深入问题的结构,找到其最本质的核心要素,然后重新构造答案。
不断创造商业奇迹而成为世界首富的马斯克在回顾这些成就时说:“第一性原理是一种物理学的思考方式。你必须剥离假设,把事物拆解到最基本的真理,然后从那里推理。”
这是因为“唯一的规则是物理定律所规定的。其他一切都是建议”。
同样,演绎推理是人类最核心的思维能力之一,我们没有理由不去使用它、强化它。
四、心理:
理解自己,洞悉他人
面对伟大的使命、面对可能的巨大成功时,我们的第一反应不是兴奋,而是怀疑甚至恐惧:“我配吗?”
人本主义心理学家马斯洛把这种现象称为“约拿情结”,即我们不仅害怕失败,更害怕成功。
有时阻止你登上自我实现巅峰的最大敌人,不是别人,而是你自己。
当你担心高处不胜寒,成功会引起朋友或亲人的妒忌;
当你担心成功后,会有在聚光灯下暴露于众的尴尬;
当你担心爬得越高,跌得越惨;
当你担心成功只是昙花一现,荣耀转瞬即逝时,你就成了阻碍你成功的最大敌人。
这也是为什么在视频生成领域,绝大部分人都专注于几秒而不是几十秒的短视频生成,因为几十秒的短视频生成涉及对物理世界的真正模拟能力。而这,被视为视频生成难以逾越的鸿沟。
但是,为什么OpenAI的年轻人没有约拿情结?
在现代心理学的视角下,幸福感由底层的物质幸福感、居中的心理幸福感和高层的社会幸福感三个层次组成。
从追求物质幸福感到心理幸福感,最后到社会幸福感,这三个层次反映了人类追求的不同阶段。
2016年8月,黄仁勋把第一台超算DGX-1捐给成立还不到一年的OpenAI,此前捐款1亿美元的马斯克也被邀请见证。在DGX-1机器的外壳上,黄仁勋写道:
致埃隆·马斯克和OpenAI团队:
为了计算和人类的未来,我捐出世界上第一台DGX-1。
所以,无论黄仁勋还是OpenAI,从一开始追求的就是社会幸福感,而不是把工作作为谋生或财务自由的手段,也不是把工作作为自己在峰巅俯视众生的梯子,而是为了“计算和人类的未来”,这也是OpenAI一上来就要创新几十秒的视频生成的原因。
所以,OpenAI年轻人的“野心”(使命)就是他们幸福感的来源。
马斯洛说:“如果你总是想方设法掩盖自己本有的光辉,那么你的未来肯定暗淡无光。”
五、修辞:
说服他人,引领革新
修辞是古希腊通识教育的核心内容之一,亚里士多德在《修辞学》中指出,修辞的本质是“发现在每种情况下最可能说服他人的方法”。
因此,修辞不仅仅是演讲或写作技巧,更是一种思维方式,用于影响他人、传递信息、塑造观点。
例如,许多成功的创业者之所以能吸引投资人,不是因为他们的商业计划书有多完美,而是因为他们能用修辞的技能去讲述一个有吸引力的故事。
投资人愿意投资,不仅因为数据支持,更是因为他们被打动了、信服了。
其实,我们在日常生活中也经常使用修辞技巧:从去哪里聚会、旅游,到说服老板支持你的方案、项目,再到在社交媒体上表达观点、发出倡议等。
修辞的核心作用是促使社会成员形成统一的行动目标和价值观,即共识。
在当今这个信息流动迅速、全球化程度越来越高的社会中,共识的作用越来越大,从而形成共识溢价。
共识溢价是指社会、市场或群体对于某一对象的共同认同和偏好,导致该对象的价值或价格在一段时间内高于其实际价值的现象。
在AGI时代,AI可以更加高效地通过修辞实现更为广泛的共识。
在情感方面,通过对社交媒体的情感分析,以及对舆论热点、社会焦虑和期望的监控,AI可以更高效地实现对民众情感和需求的把握和调动。
在逻辑方面,AI可以在去中心化的网络中建立共识系统,而不仅仅依赖单一的权威机构。AI可以用来自动验证、记录并更新共识产生过程中的数据,确保数据的透明性和真实性。
在权威方面,AI的自然语言处理技术可以打破语言和文化障碍,促进全球范围内的沟通与理解,帮助实现跨文化、跨语言的共识。因此,如何借助AI实现更广泛的共识,是AGI时代必备的技能。
修辞学不再仅仅是口头或书面的表达技巧,它在AI时代需要向更高层次的"数字修辞"延伸,即如何利用AI技术有效沟通、说服、引导群体。
修辞能力不应局限于语言表达,更涉及数据表达和技术表达——我们不仅要通过文字、语音或视频传递信息,还要理解如何在数据背后传递情感和人类需求。
也就是说,要通过情感计算、数据可视化等技术,将AI的分析结果转化为易于理解、能打动人心的语言和图像。
未来学家雷·库兹韦尔曾说:“奇点临近,向新世界秩序的转变将以人类在宇宙中角色的新共识为特征。”
AI将改变我们对人类角色的认知,并推动建立新的全球性共识,尤其在科技、伦理、工作和治理方面。
人类精神的觉醒始于在虚无中对意义的叩问。
因“研究”而获得的正确问题犹如明灯穿透色彩斑斓的幻觉以指向通往真理的航路。
“统计”的力量,则以数学的严谨在混沌中洞察细微的线索与深藏的秩序,解码表象背后的机理。
从这颗蕴含第一性原理的种子出发,无懈可击的"逻辑"质疑固有的框架并创造出一种全新的可能,无限接近真理。
当我们的认知触达凌乱无序虚妄中的原始存在,我们才会从枯燥、重复和纷扰的日常工作生活获得解脱,获得那种远离焦虑、抑郁、迷茫的平静与自由。
这种解脱并非消极出世,而是“心理”在澄明之境中获得的创造权杖。
“修辞”不再是一堆华丽的符号,而是升华为行动的号角,唤起他人心中的共鸣与理想,为自己发声,更为社会福祉和人类的未来。
*文章为作者独立观点,不代表笔记侠立场。