李飞飞访谈:AI是文明级别技术,我们如何掌控技术发展方向盘?
开篇:时代之问,AI何往?
ChatGPT的横空出世,让人工智能(AI)以前所未有的速度和热度席卷全球,激发了人们的兴奋、期待、焦虑和迷茫的情绪交织。一个根本性的问题摆在所有人面前:AI的未来将走向何方?我们是驾驶着这艘快船驶向星辰大海,还是在不经意间打开了潘多拉魔盒?
带着这些深刻的疑问,我们深入探讨了全球人工智能领域的领军人物、斯坦福大学教授李飞飞在2025年5月13日的一次深度对话中所表达的思考。作为ImageNet的创建者之一,她不仅是推动这轮AI浪潮的关键人物,更是“以人为本AI(Human-Centered AI)”理念的坚定倡导者和践行者。在这篇万字访谈精华中,李飞飞教授将为我们揭示AI的本质、未来的机遇与挑战,以及最重要的——我们如何掌控舵,确保这项“文明级技术”真正为人类福祉服务。
一、核心解码:AI——重塑文明的力量,而非简单工具。
在对话的开篇,李飞飞教授就抛出了一个极具分量的论断:
“人工智能是一项具有深远影响的技术,足以改变人类文明的发展方向。现在,我们已经明确地看到,人工智能对我们的社会产生了深远的变革性影响,这些影响已无可置疑地展现在我们面前。”
这一定位,将Artificial Intelligence从单纯的技术工具提升到了关乎人类社会结构、经济模式乃至地缘政治的战略高度。它不仅仅影响着我们的工作方式(“这关乎就业”),更深刻触及政府治理、国际关系。面对如此深远的影响,我们不禁要问,人类该如何引领其发展方向?李飞飞教授的核心答案是,以人为本。
二、核心解码:追光者——驱动一位AI先驱的「双子星」
李飞飞教授在AI领域的卓越成就源于其内心深处持久而纯粹的驱动力,激发着她前行的激情。回顾她的科研历程,从早期对物理学的痴迷,到毅然投身尚处“寒冬”的人工智能研究,再到主导创建ImageNet这一里程碑式的项目,直至创立斯坦福以人为本AI研究所(HAI)和探索空间智能的World Labs,她的每一步都闪耀着理想的光芒,照亮着她的科学之路。
在她的世界里,有两颗“北极星”始终指引着方向:
李飞飞的科研“北极星”,引领人类探索宇宙的未知领域,推动科学技术的前进步伐。
第一颗星:永不熄灭的好奇心。李飞飞坦言,她对智能科学和制造智能机器的探索欲,是她科研生涯最原始也是最持久的驱动力。她被物理学家那种敢于提出“最大胆问题”(如宇宙边界、最小粒子)的精神深深吸引,并将其融入AI研究中,不断向未知领域发起挑战。
第二颗星:坚定不移的技术向善(Benevolence of Technology)随着AI技术的飞速发展和影响力的剧增,李飞飞越来越深刻地认识到技术背后的人文关怀。她的心中燃烧着一盏明灯,即技术可以为人类造福的坚定信念。她说:“我坚信技术可以为人类造福”,这种信念指引她去做那些以人为本、符合她所信仰的人类价值观的事情。
正是这两颗“北极星”,让她在面对AI发展过程中的喧嚣与不确定性时,始终保持着清醒的头脑和坚定的方向。
“飞飞金句”: “我这一代人,包括我自己的工作,已经将人工智能带入了一个我从未想象过的、具有更加 Revolutionary 和深远影响力的时代强大的力量也伴随着巨大的影响。”
三、实践蓝图:“以人为本”AI如何落地?
“以人为本”不仅是一句空洞的口号,李飞飞教授确实为其构建了一个清晰的实践框架,即一个“三重同心圆”价值模型。
"以人为本",AI价值同心圆模型,旨在将人性化和技术结合,构建更加人性化和智能化的AI系统。
内圈:赋能个体,尊重尊严与隐私:AI技术首先应服务于每一个具体的人。李飞飞教授以她在斯坦福的医疗健康研究为例,利用智能传感器帮助老龄人口和慢性病患者,目标是“赋能人们,尊重人们的尊严”,同时必须警惕技术对个人隐私和自主权的潜在侵犯。
中圈:促进社群共荣与创造力,AI 应该成为社群发展的催化剂,而非取代者。例如,在生成式AI时代,技术应该赋能创作者,提升其创作效率和可能性,而不是剥夺其创意价值和劳动成果。关键在于“增强人类的能力,而不是取代”。
外圈:实现社会普惠与共同繁荣在更宏大的社会层面,AI作为“文明级技术”,其发展必须指向提升整体生产力,并“确保共同繁荣”,这涉及到就业结构调整、教育体系革新、以及更公平的资源分配等重大议题。
在"以人为本"的框架下,李飞飞教授敏锐地察觉到了AI技术发展的新前沿——空间智能(Spatial Intelligence)。她认为,理解3D空间,并与之交互,对人类智能的发展至关重要,也将是下一代AI的核心能力之一。
“飞飞金句”: “空间智能的根本之所在,确实是3D,因为空间本质上是三维的。能够对3D空间进行建模,从而创造出数学上可靠的3D世界,这打开了前所未有的大门。”
空间智能核心价值与应用场景图:该图展示了空间智能领域的核心价值观念和应用场景的交叉点,涵盖了空间数据的收集、存储、处理和分析、应用和解释等方面,旨在帮助企业和个人更好地理解空间智能的核心价值和应用前景。
四、未来展望:AI的星辰大海——机遇、挑战和我们的角色
人工智能的潜力远远超出我们当前所熟悉的聊天机器人或图像生成。李飞飞教授展望,AI将在更广泛的领域引发变革的巨浪。
机遇的广阔天地:从AI加速新药研发、实现个性化精准教育,到助力气候模型预测、提升农业生产效率再到赋能政府提供更高效的公共服务,AI的应用前景几乎遍及所有行业。李飞飞预言道:“任何有芯片的地方,未来都将有人工智能。”
浪潮下的清醒认知:挑战与应对然而,机遇与挑战并存。李飞飞也直言不讳地指出了当前AI发展面临的隐忧:在机遇的背后,存在着挑战的阴影,为我们带来了沉重的责任和压力。
面对这些挑战,她为技术人员和政策制定者都提出了宝贵的建议,旨在推动产业的可持续发展和社会的整体进步。
对技术者的挑战正在于探索和掌握新技术的可能性和前景,为更好的生活和发展做出贡献。
“保持那份谦逊。我们接受训练是为了探索真理,而在技术、科学和人性的面前,我们应该努力保持谦逊的态度。”
对政策制定者:他们需要具备广泛的知识面和深入的分析能力,能够充分考虑各种因素,包括经济、社会、环境和政治因素,从而制定具有指导性和可操作性的政策。
必须遵循三大基石——沟通、分享和互动,构建起一座坚实的关系楼台,以便更好地与他人交流、分享经验和思想,达成更大的共鸣和影响。
科学,而非科幻:科学家们通过实证研究,探索宇宙的奥秘,揭开自然规律的面纱,开启人类未来的发展之门。
政策应基于事实和数据,而非夸张的想象。
实用主义,而非意识形态,它强调将理论和价值观结合实际操作,追求现实的解决方案,而不是仅仅依靠理论或意识形态的指导。
关注AI在具体应用中的实际影响,务实监管,以免扼杀上游创新。
生态共荣,而非垄断:在这个不断演变的世界中,我们需要重新思考企业的责任和企业家精神,寻找一种能够同时满足企业和社会需求的发展模式,而不是单方面地追求利润和增长。
大力扶持整个创新生态,包括学术界和初创企业,确保技术发展的普惠性。
信息泛滥与公众教育缺失:在今天的数字时代,信息的爆炸性增长与公众教育的不完善导致了一个奇怪的现象,即人们越来越难以辨别真实与虚假,越来越难以获取高质量的信息。
AI生成内容的便捷性可能加剧虚假信息的传播,而公众对AI的认知亟待提升。
创新生态失衡风险:创新活动的蓬勃发展,可能会对生态环境产生不良影响,导致生态系统的失衡和破坏,引发环境污染、资源枯竭、生物多样性丧失等问题,威胁人类赖以生存的生态安全。
AI 研发资源,如算力和数据,高度集中于少数巨头,这可能对整个生态的长期健康和多元化创新产生不利影响。
“飞飞金句”: “我们正身处于历史性的转折点,AI的发展不仅仅是技术问题,更是关系我们期望构建什么样社会的关键挑战。”
五、行动号召:共同塑造AI的未来,你我皆是参与者
李飞飞教授的洞见,如同一盏明灯,照亮了AI发展的前路,激发了我们每个人更深层次的思考。人工智能的未来并不像预先编写的剧本,它的走向,取决于每一个关注并参与其中的“我们”手中。
关于AI的未来,你最关心什么?你认为“以人为本”的AI应该如何更好地实现?从现在的发展趋势来看,以人为本的AI对人类社会的影响将是深远的。首先,这种AI将使我们能够更好地理解人类的情感和需求,从而提高人机交互的体验和效率。其次,以人为本的AI还将帮助我们解决一些社会问题,如教育、医疗和环境保护等领域的挑战。
欢迎在评论区留下你的思考与见解,让我们一起探讨,共同塑造一个更加智能、也更加美好的未来。
如果这篇文章让你有所启发,请不吝分享,让更多人听到来自AI前沿的真知灼见。
------------ ------ ------
以下对话来自 Hugo 和 Duncan 主持的播客节目翻译,嘉宾为人工智能领域的知名学者李飞飞(Fei-Fei Li)。全文约14000字,阅读约15分钟左右,精彩纷呈,建议收藏、转发。
------------ ------ ------
开场(Hugo):
人工智能是一项具有深远影响的技术。现在,我们已经清晰地认识到人工智能对我们的社会所带来的革新性影响已无可置疑。这种影响关乎就业、关乎政府如何被人工智能所影响、关乎地缘政治等多方面。我们如何应对这些挑战?如何与立法者合作?如何与普通公民合作?如何确保这项技术不会撕裂我们的社会?如何确保利用技术提高生产力同时也能保障共同繁荣?这些都是与以人为本的人工智能相关的更大的社会问题。因此,这些以人为中心的同心圆环对于当今的人工智能时代都至关重要。
刚才大家听到的是李飞飞关于人工智能作为一项文明技术,以及为何我们需要在塑造其未来时以人类价值观为中心的论述。在本期 High Signal 节目中,Duncan Gilchrist 和我将与李飞飞一同探讨她卓越的职业生涯,这段旅程横跨物理学、神经科学、ImageNet,以及现在空间智能和 3D 基础模型的前沿领域。我们将从人工智能的早期阶段谈起,那时该领域尚处于某种意义上的寒冬,并回顾李飞飞的工作如何助推了深度学习革命。我们将讨论好奇心如何成为指路明灯,以人为本的人工智能在实践中究竟意味着什么,以及她的初创公司 World Labs 如何重新构想我们与空间、传感器和机器的互动方式。这是一场关于科学、责任以及下一波人工智能浪潮可能如何在研究实验室乃至整个社会中展开的对话。
如果您喜欢这些对话,请给我们留下评论,给我们五星好评,现在,在进入采访之前,我们先和Duncan聊几句,探索一下他心中的秘密和想法。
Hugo:我现在和来自 Delfina 的Duncan在一起。嗨,Duncan。
Duncan:嗨,Hugo,你好吗?
Hugo:我很好,谢谢。我想和大家分享一下,在 Delfina 的工作给我带来了许多有趣和挑战的经验。我在 Delfina 的工作主要是负责项目管理和策划,我们不断地推出新项目,为用户提供更多的选择和体验。我认为,这些经验对我来说非常有价值,因为它们让我更好地理解用户的需求和预期,为我们制作 High Signal 提供了有价值的参考。
Duncan:在 Delfina,我们正在为数据科学构建人工智能代理,通过我们的工作性质,我们与该领域的许多领导者接触。因此,我们通过播客分享这些高价值的信息,旨在为关心数据科学和人工智能的人提供有价值的经验和见解。
Hugo:的确如此。我们与李飞飞的对话非常精彩,马上就要开始了。但我想知道,这次对话中让你印象最深的是什么?
Duncan:在我的职业生涯中,我一直将人工智能和机器学习视为一种提升表现的杠杆,优化模型,提升指标,逐步提升业务水平。但是,李飞飞的一句话让我为之震颤,她说人工智能是一项文明技术。它不是一项功能,也不是一个行业,而是关乎文明的基础。就业、地缘政治、社会结构本身都包含其中。今天的对话直面了这项工作的机遇与重任,让我们开始吧。
Hugo:嗨,李飞飞,欢迎来到节目。
李飞飞:嗨,Hugo。谢谢你。
Hugo:非常荣幸能邀请到你。你的职业道路非常出色,涵盖了研究、创业、教育等多个不同领域和工作类型。我很好奇,在你看来,这段发展历程中有哪些关键的转折点?
李飞飞:我感激您的问题,我职业生涯的经历,以及其中的一些关键时刻。第一个转折点是发现我的初恋,那就是物理学。在我十几岁的时候,大约12岁左右,我发现了物理学的世界,那是一个简单的开端,对吧?仅仅是力学、光学、电磁学就为我打开了一扇门,我想那种痴迷那种好奇心那种科学世界的奇思妙想从那时起就一直伴随着我。所以,那是一个关键时刻。另一个关键时刻是在人工智能的早期阶段从事人工智能研究,我的博士阶段,那是一个非常私人的层面上是关键性的,因为那时人工智能默默无闻,没有如今这般喧嚣,世界也几乎不谈论人工智能,事实上,那时正值人工智能的寒冬,人工智能这个词都很少被提及。但正是那时,我发现了一门直击智能核心的科学,它为我打开了研究智能如何运作以及制造智能机器的大门,特别是视觉智能机器,那是一段令人难
随着我身处于约2018年的计算机科学家、技术专家和人工智能教育者的身份,我突然领悟到人工智能不再局限于我的个人热爱。我这一代人,包括我的工作,已经将人工智能带入了世界,带来了我从未梦想过的、更具变革性和影响力的方式。强大的力量也伴随着巨大的影响。它已经演变为一项文明技术,既给我们带来巨大的希望和机遇,也带来了深刻影响人类的巨大后果。突然,我意识到,我应该回到斯坦福大学,建立以人为本的人工智能研究所,真正去研究、探索并推广将人类价值观置于人工智能发展核心的理念。因此,对于像我这样的技术人员来说,那是一个意识到我所热爱的科学不仅仅是技术本身的时刻。
我正在踏上最新的一趟旅程,目标是成为一名企业家,创立 World Labs,和我以前的学生和技术精英一起在这个平台上工作。特别是在当前的人工智能时代,尤其是生成式人工智能时代,我非常高兴和有趣地创造一种我们认为世界前所未见的技术和产品。
Hugo:太酷了。感谢你如此详尽地分享了许多对你产生影响以及你所产生影响的事情。我非常期待能深入探讨以人为本的人工智能、空间感知以及你在World Labs的工作。但回顾你的历程,从最初对物理学的热爱,到计算机视觉、卷积神经网络和ImageNet,再到如今人工智能领域发生的惊人进展,当然还有以人为本的理念,这是一段复杂性不断增加的旅程,对吧?物理学的世界固然令人兴奋且充满挑战,但与这些系统互动和思考所需的复杂性相比,它似乎还算简单,然后才是接近以人为本的层面。我在想,你刚才描述的这段旅程,虽然并非线性,但现在看来是一条清晰的道路。我相信,这条路的信号并非一直都那么明显。所以,我很好奇,在整个旅程中,你是否有自己的个人“北极星”,或者是什么驱动着你,以及你如何找到那些让你能够沿着这条路走下去的信
李飞飞表示,Hugo 的问题确实值得思考。许多年轻人曾经问过我这个问题,因为当我们回头看时,它似乎是线性的,但实际上,这确实如此。这尤其适用于科学家的职业生涯,也适用于企业家的旅程。我们常常会在黑暗的道路上行走,我们常常会在不确定的道路上行走。未知远远超过已知。最近,我写了一本书《我所看见的世界》,这本书的核心论点是关于“北极星”。我想说,一直指引我的绝对“北极星”始终是好奇心。我认为这对于人类的价值观和创造力来说是非常核心的。我一直非常执着,甚至有点天真地勇敢地去追求好奇心,因为我觉得这本身就很有趣,它超越了个体,甚至超越了我们眼前的事物。这就是一颗“北极星”,而我的好奇心一直是关于智能科学和制造智能机器,这在我职业生涯的道路上引领了我很远。随着我作为一名
Hugo:我深受这个说法的吸引。我发现许多在我认为有趣且富有价值的领域工作的人,也同样被这两件事驱动着。我的好奇心非常强烈,我想进一步探索,因为在当今的环境下,有太多事物能够激发人们的好奇心。每周都有新的模型、新的工具等等出现,那么好奇心会过头吗?或者,当你的好奇心可以将你引向任何地方时,你如何决定关注什么?
李飞飞:嗯,这其实是一个非常好的问题。我想你总是可以“过于”怎样,然后在后面加上一个形容词。回顾起来,我之所以热爱物理学,不仅仅是因为牛顿定律、麦克斯韦方程组,以及后来的量子方程。实际上是因为物理学能够提出大胆的、具有挑战性的问题。在所有科学家中,物理学家似乎对提出最为 Massive 和有前瞻性的问题有着令人难以置信的兴趣和信念,例如:宇宙的边界、最小的粒子,以及如何统一各种力等等,其中一些问题至今仍没有答案。我认为,这种找到一个极其大胆、难以解决或找到答案的问题的能力,再加上它提供了一个明确的方向,让你可以在多个方向上探索。但当有了一个方向时,用物理学的话来说,它几乎就像一个场。 一旦你有了一个场,你的好奇心就有了一个可以对齐的方向。至少对我自己而言,在物理学和人工智能领域受过训练后,我被大胆
Hugo:太棒了。所以,我听到的是,好奇心是以问题为条件的。我开玩笑说,我可能是一个贝叶斯主义者,因为你永远不能说你是一个贝叶斯主义者。我也从条件概率的角度思考问题,我完全同意关于物理学的观点。我以前是纯粹数学家,人们认为那有点不切实际,但我总是说,我们总是在追赶物理学家,对吧?就像他们会做一些在数学上毫无意义的事情,比如狄拉克δ函数,然后数学家们不得不追赶上来,说“哦,让我们把它形式化”,所以我完全同意物理学思维方式的观点。
我想谈谈“以人为本”,这个概念在当前的人工智能系统背景下具有更加复杂和深远的含义。它不仅仅是指人为中心的设计和开发,更是指在设计和开发过程中,充分考虑和尊重人类的需求、情感和价值观念,以确保人工智能系统的发展是有益于人类的。
李飞飞:是的,对我来说,“以人为本”是人工智能的另一个“北极星”,即人工智能可以是一个技术家族,也可以是产品和服务。但对我来说,那个“北极星”是为人类和个人造福。这就是我如何看待“以人为本”,当然,这会受到我们所处社会的价值观的引导。在我脑海中,我将“以人为本”想象成三个同心圆。最内层是个体,我们希望创造能够帮助个体、赋能人们、尊重人们尊严的技术。我在斯坦福大学做了许多医疗保健方面的工作,特别是利用智能传感器帮助老龄人口和慢性病患者更好地生活,并捕捉那些可能导致不良后果(如果得不到护理)的临床相关时刻。即使怀着这样美好的初衷,人工智能技术也可能无意中跨越一些界限,这些界限实际上对我们的价值观提出了质疑,无论是隐私问题还是剥夺个人自主权。因此,在开发这类技术时,我们需要
在同心圆的中间稍大一点的层面,对我来说是社群。人们聚集在一起形成社群,而人工智能是一种可以在帮助社群方面发挥巨大作用的技术。例如,在当今的生成式人工智能时代,创作者们创作了大量内容。现在,生成式人工智能也可以创作内容,那么,生成式人工智能与创作者之间的关系是什么?我们如何赋能他们?我坚信,我们是为了增强人类的能力,我们利用技术来赋能人们,而不是要剥夺创造力,也不是要剥夺本应属于艺术家和创作者的东西。这些都是我们需要以人为本的方式去努力解决的价值观和问题。
最后但同样重要的是社会层面,人工智能是一项文明技术。我们现在知道,我认为现在几乎毫无疑问,人工智能对我们社会的影响是深远的变革性。这种影响不仅与就业有关,还与政府如何受到人工智能的影响相关,甚至触及地缘政治。那么,我们如何应对这些挑战?如何与立法者合作?如何与普通公民合作?如何确保这项技术不会撕裂我们的社会?如何确保既能利用技术提高生产力,又能保障共同繁荣?这些都是与以人为本的人工智能相关的更大的社会问题。因此,所有这些以人为中心的同心圆环对于当今的人工智能时代都至关重要。
Hugo:当然。我非常喜欢你将其描述为从个体到社群再到整个社会的同心圆。我完全同意,我们正在经历一场如此基础性和根本性的变革。我不是第一个这么说的人,但我确实认为,即使基础模型的开发今天就停止(显然不会),我们仍需要几十年的时间来探索应用和如何使用它们。我完全同意你的评估,即试图弄清楚它们如何帮助大规模组织运作,因为我认为,我个人的看法是,生成式人工智能工具目前对于小团队和个人来说非常棒,但大型组织还没有弄清楚如何将它们整合到自己的流程中,因此目前它们实际上可能会减慢这些组织的速度。我喜欢你给出的例子,我很期待能深入探讨空间感知、基于传感器的技术,或许还有物联网方面的内容。但我想知道,你是否可以分享一些对你形成以人为本的人工智能方法影响最大的经历?
李飞飞:我是一名移民,我认为这是一种深刻的经历。特别是在我15岁时,从中国搬到新泽西,那是一个极具塑造性的时期。在我的书中,我确实描述了被移植到一个拥有新语言和新文化的全新社会,这在某种程度上是极具冲击性甚至是创伤性的,但对于一个青少年来说,也是一种全新的体验。我非常感激的是,在我家庭之外的人们,给予了我人性的温暖,展现了善良和同情的光芒。在我的书中,我特别提到了一个家庭,那就是我的高中数学老师 Bob Sabella 和他的家人,他们是如何真正地向我伸出援手,帮助我和我的家人,帮助一个真正的青少年。那样的同情心,如同一颗最美丽的人类价值观的种子,在我年轻的时候就种在了我的心里。我也感受到,在我职业生涯的道路上,尤其是在人工智能的早期阶段,那是一个如此崭新的领域,每个人都充满了好奇心。我的导师、我的教授
最后但同样重要的是,在我的书中,我多次提到一个人,那就是我的母亲,她是一位坚强、坚定的女性,但几十年来身体一直不太好。我们之间存在一种深深的共生关系。表面上看,我照顾她,我是她的翻译、看护人和医疗个案经理。我经历过从急诊室到救护车、从手术到重症监护室、从住院到我想不到的所有医疗场景。另一方面,她也是一位如此坚强的女性。她向我展示了那种坚定的信念,尤其是一位母亲对我的热情信念。即使在移民生活中最艰难的日子里,尤其是在经济和医疗方面,她对我的热爱科学、对人工智能的热情、对我成为一名科学家的热情,比我自己还要坚定不移。那种信念和热情的火花,以及无条件的支持,也向我灌输了我如此珍视的价值观。这些只是一些例子。总而言之,我见证了人性中最美丽的部分——同情与
Hugo:当然。感谢你分享如此私人的故事。我回到了澳大利亚,父亲已经85岁了。作为早产儿,这也是我搬回来的一个原因之一,所以我能理解这些事情。我经常思考这个问题,但我从中听到的是一种张力,即随着年龄增长,人类身体的脆弱性与人类精神令人难以置信的强韧和活力之间的张力,以及这两者如何结合。这对我来说非常有意义。当然,无论如何,这也是你对老年护理特别感兴趣的原因。
这种问题引出了我对以人为本的人工智能方法的重要性的理解:老年护理和气候变化等应用领域确实凸显了以人为本的人工智能方法的重要性。首先,在老年护理领域,人工智能可以帮助医疗机构和家庭护理人员更好地理解和预测老年人的需求和需求变化,从而提供个性化的护理服务。其次,在气候变化领域,人工智能可以帮助科学家和政策制定者更好地理解和预测气候变化的影响和结果,从而制定更加有效的应对措施。
李飞飞说,Hugo,坦率地讲,人工智能的跨领域性是如此强调,我认为它几乎涵盖了所有领域。当然,在医学领域,它具有尤为显著的解释性,由于我个人的经历,我对人类医疗保健服务的提供和帮助弱势群体特别关注。无论是我们讨论的环境智能传感器、未来的机器人还是更好的诊断工具,这些都是非常有前途的领域。你也提到了可持续性和气候问题。人工智能在帮助绘制我们的生物多样性、了解我们的海洋、模拟天气和气候,以及帮助我们发现新能源形式方面,都有着令人难以置信的机遇。两年前,核聚变领域的突破很大程度上是美国国家实验室机器学习方法改进的结果。
但还有例如教育领域。我非常激动地看到,教育,我们的人类教育体系并没有改变,特别是在西方发展起来并主导着整个世界的教育体系,在过去一百多年甚至两百多年里一直保持不变,尤其是在 20 世纪初形成的教育结构。然而,信息编码、传输和分发的方式已经经历了翻天覆地的变革,对吧?就像我们现在拥有计算机、互联网和人工智能。因此,我实际上认为,生成式人工智能确实是对教育系统的一次警醒,这不仅仅是 K 到 12 年级的教育,现在我们触手可及。我们拥有实现终身持续学习的工具,这是人工智能应用的另一个非常重要的以人为本的例子。
我还认为,人工智能有一些不太引人注目的或不那么受赞誉的应用实例。例如,农业。农业实际上对全球福祉至关重要,然而,如何提高农业效率,如何帮助人类减轻繁重的体力劳动?这些都是人工智能可以帮助实现的深刻变革。
最后但同样重要的是,我还想特别指出全球范围内的政府本身。每个社会都在与政府打交道,而政府的有效服务对每个人都有着深远的好处。人工智能在技术的帮助下为人民服务的这个领域是一个巨大的机遇。因此,在每一个行业,我们都能找到以人为本的人工智能应用实例。
Hugo:当然。 我非常喜欢这些例子。我在教育领域工作了许多年,因此认为这是一个非常关键的例子。我的个性化教育的未来的展望感到非常兴奋,因为许多教育仍然采用广播模式,而不是针对个体的个性化教育。因此,我认为这是一个非常丰富的领域,我非常期待去探索。
我也喜欢这次对话正朝着我称之为“未来音乐”的方向发展,对吧?因为我们正在讨论所有这些我们开始发现的应用,而我们迄今为止所取得的成就让我感到难以置信的激动。我们经历了所谓的“聊天 GBT 时刻”。在此之前,当然,我们经历了,恕我直言,一个“稳定扩散时刻”,我认为这同样重要,尽管不像前者那样引人注目和在文化上被广泛讨论。然而桌面上还有如此多令人兴奋的事物,你也暗示了其中的一些,例如基于传感器的技术,甚至机器人技术和空间感知。因此,我们现在,聊天 GBT 在某些方面似乎显得有些过时,哦,你现在可以和软件对话了,太棒了,但还有更多更丰富的机会摆在面前。
我知道空间感知是你思考和研究很多的领域。因此,我想知道你是否可以给我们做一个简要的介绍。什么是具有空间感知能力的人工智能,它为什么重要?具有空间感知能力的人工智能可以说是指那些可以从感知环境中的空间信息中获取有用的数据和知识的人工智能系统。这种人工智能能够通过感知环境中的空间关系、位置、距离和方向等信息,来实现更好地决策和控制。这种能力对许多领域非常重要,如自动驾驶、地面机器人、无人机、游戏等。
李飞飞表示,对所谓的空间智能,他感到非常激动。他认为,它是整个智能,或者称为人工智能(AI)或通用人工智能(AGI)的一个关键组成部分,因为理解三维空间,能够与之互动,并在其中创造、创新和完成许多任务,对动物智能,特别是人类智能来说是非常重要的。对计算机、机器人、虚拟代理等等来说,也将是非常重要的。因此,这就是空间智能的总体框架。空间智能的核心在于三维,因为空间是三维的。能够对三维空间进行建模,从而创造出三维的或者说数学意义上的三维世界,这打开了前所未有的大门。
任何创作者都知道,为了真正发掘创作潜力,他们在创作过程中需要一种可控性和一致性来确保作品的整体性和协调性。无论是设计家具、室内布置、创作电影、制作营销材料,还是仅仅为了好玩,或者我们看到的电子商务领域。所有这些领域,创作者都需要具备令人难以置信的控制力和预见性,而空间智能人工智能技术可以真正帮助普及这项技术,降低创作中的能量壁垒,释放创作者的潜力。
全球市场的主要部分都涉及到与不同空间的互动。当然,如果你有孩子,你自然会举出游戏的例子,这确实如此,对吧?游戏具有极强的互动性,且大多是 3D 空间。但是,除了游戏之外,还有更多的例子。你在教育领域工作,无论是职业教育还是 K12 教育,许多教育体验旨在理解某些概念,想象一下教孩子太阳系,如果它是 3D 的,就会变得更加容易。当我们拥有数字化的虚拟能力,可以创造出 3D 的虚拟世界与之互动,那么,从游戏到互动体验,再到职业培训,无论是体育运动、学习成为外科医生、做煎蛋卷,还是你能想到的任何事情,都将打开新的机遇之门。
因此,这是一个新的领域。 最后,但同样重要的是,我只举三个例子,我们对机器人的未来充满激情。它们不仅仅是能够在复杂的世界中导航和执行任务的人形外星机器,以便它们能够协助人类。可以将其称为某种类型的机器人,包括汽车本身。为了让机器人在世界上导航并能够在世界上帮助做事,无论是更换灯泡、在仓库中搬运物品还是在自然灾害中救援,所有这些都需要空间导航和了解正在发生的事情,这就是空间智能。
所有这些例子都告诉我们,Hugo超越了语言,它需要一种不同的语言,而那种自然的语言、空间的语言恰是空间智能和3D表征的天然延伸。
Hugo:我对这种说法非常感兴趣,也钟爱所有这些例子。作为建筑师的朋友很多,我认为这只是一个玩具般的例子,但它却是这种哲学的一个典型代表。建筑软件通过 CAD 等工具,让我们与现实世界保持距离,对吧?然而,人工智能和具有空间感知能力的人工智能却能够让我们在使用软件的同时回到那些空间,我认为这真的非常有趣。因此,正是计算使我们能够重新接触到现实世界。
我对多模态模型的发展感到非常兴奋。 Gemini 2.5 是一个例子,老实说,我觉得它非常引人入胜。它不是一个传统的 LLM,但它拥有一些 LLM 的能力,可能是通过进行图像分析、剪辑预处理等操作来创建图像。我确实想知道,是否会出现基础模型或其他形式的模型,它们是 LLM 和视觉模型的结合体,并且具有空间感知能力,甚至可能是机器人化的?
李飞飞:当然。我认为将会出现越来越复杂的基础模型。您知道,我所在的公司 World Labs 正在为空间智能和 3D 世界生成开发基础模型。如果你指的是一个结合了一切的单一巨型模型,那是一个有趣的思考方式。我相信会有人尝试。这将非常消耗资源,特别是数据和计算资源,但这几乎就像爱因斯坦想做的那样,统一所有的力。它几乎有那种味道。因此,这是一个伟大的智力假设。但是在我们得到那个单一的巨型大脑人工智能(人类确实拥有)之前,我们将看到越来越多针对不同多模态、具有不同焦点的基础模型。
Hugo:太酷了,我骨子里其实是一个黑客。因此,人工智能领域让我钟情的一点是,至少最近,它让我们回归了 Unix 哲学——不同模型的模块化、可组合性等等,这种结合非常有趣。
我对一个问题很感兴趣,因为目前关于具有空间感知能力的人工智能的公开讨论还不多。因此,我想知道你是否能帮助我们思考一下,具有空间感知能力的系统有哪些可能被低估的实际意义?
李飞飞认为,3D 是一种用于计算、用于编程的语言,因为我们看到许多像素被生成出来,并且它们非常美丽。但是,这其中的一个问题是,如果你只是在平面屏幕上生成像素,它们实际上缺乏信息。测量平面屏幕上两个像素之间的距离非常困难,这与 3D 世界中两个像素之间的距离有着根本的不同。当你把它们放在平面屏幕上时,你能用它们进行的计算非常少,对吧?你如何添加阴影?如何改变相机角度?如何处理遮挡?如何重新打光?如何测量?如何在其中放置东西?如何取出东西?所有这些都变得非常困难。因此,我认为,一旦我们拥有了真正 3D 意义上的空间智能,这种情况就会改变,我对此非常兴奋。
Hugo:太棒了,我很感兴趣。我知道我不是在打探任何商业机密,也不想过多地刺探World Labs的情况,因为我知道很多事情都还在保密阶段,但我想知道关于你对大规模世界建模的愿景,以及是什么促使了World Labs的工作,你能分享一些什么?
李飞飞指出,激励他的有两个原因。首要的是,他认为有太多的用例,我们刚才已经探讨了一些,对吧?从创造力到体验和互动,再到机器人技术、教育、医疗保健、制造业和农业,这些用例的丰富性简直让人眼界开阔。如果你浏览全球市场在媒体和娱乐、游戏、AR/VR/XR等新兴技术以及机器人技术方面的覆盖范围,那简直是让人感到激动。同时,从智力和技术角度来看,世界也应该拥有一致的世界模型,而空间 3D 智能世界模型正是生成式人工智能时代的一个基本缺失,我认为这是一个巨大的机遇。
Hugo:非常棒。我很想知道,在不超出任何已公开信息的前提下,World Labs 是否有一些实例或案例可以帮助解释和说明这个方向?
李飞飞:我想我已经提出了所有这些,对吧?创造力、创作者空间、互动体验和机器人技术,这些都是我们探索的用例。
Hugo:非常棒。转向人工智能的其他领域。我想知道目前人工智能领域有哪些进展真正让你感到兴奋?那些你认为正在推动该领域向前发展的事物。
李飞飞:我认为开源让我感到兴奋。全球范围内有一场关于开源的运动,这确实进一步促进了这个领域的发展。这是一个让我感到兴奋的全球趋势。另一个让我感到兴奋的全球趋势是,利用人工智能来极大地推动科学发现的机遇,这尤其可以而且应该发生在我们的大学校园里。因为有些人可能会有这种悲观的猜想,即在人工智能需要大量资源(如芯片和数据)的时代,高等教育和大学已经无足轻重。我实际上强烈反对这种观点,因为我认为高等教育是真正进行蓝天探索、由好奇心驱动的研究持续发生的地方。
越来越多的跨学科合作正在蓬勃发展,无论是临床医学研究、生物学、心理学、天体物理学还是土木工程,你随便选择大学校园里的任何一个系,你都会发现人工智能具有潜在的潜力,能够成为他们的有力工具,通过人工智能的支持,帮助这些学科实现科学发现和创新,这是一个我真正感到激动人心的巨大机遇。
Hugo:我完全同意。例如,我使用了许多智能体系统来为我进行模拟,就像你可以派出智能体去做各种各样的事情。我知道这是Duncan常常思考的问题,当然也是他在Delphina的工作内容。Duncan,我想知道你是否可以补充一下,你如何看待智能体系统帮助我们完成工作?
Duncan:我其实想追问李飞飞一个问题,很明显,学术界是非常注重长期的基础研究,并且真正投入于深入的理论探索。然而,在当今的世界,我们在 Twitter 和 LinkedIn 上见证了如此多快速的反应和炒作。那麼,您个人是如何在当今世界的真正进展和炒作之间划清界限的?
李飞飞说:“问得好,Duncan。你的人生一直被‘北极星’引导,这确实帮助了你,因为如果你理解了‘北极星’,你就可以用它衡量事物,或者有时你会看到一些真正令人难以置信的真实事物,那就是一颗‘北极星’实现了。但那始终是我的参考体系。我也认为尊重知识和专业技能仍然很重要。仅仅因为某人在 Twitter 上以全球规模大声疾呼,有时并不一定意味着他们拥有深厚的专业知识和学识。因此,我仍然尊重声音的来源。”
这实际上是一个非常深刻的问题,Doug,在聊天 GPT 的时代,在人工智能的时代,信息无处不在。我们如何教导我们的孩子,甚至公众,去辨别信息,去防范虚假信息?我们还没有谈到这方面的担忧。缺乏良好的公众教育是我在这个人工智能时代最大的担忧之一。我认为人们,包括政府本身,出于自身目的,有时会带着或明或暗的议程来谈论人工智能,这造成了一定的真空——也许这个词用得太重了,有些人正在努力,至少 HI 一直在努力——但实际上,在良好、可信、客观的人工智能公众教育方面,几乎是一个真空。这确实让我担忧,因为你、我以及 Hugo 可能不容易受到影响,可能不那么脆弱,因为我们受过高等教育。但是,我们有幸生活在世界上可以获取信息的地区,但并非每个人都是如此。人工智能加剧了这个问题。我们需要非常小心,避免信息的污染和误导,确保公众能够正确
Duncan:这是一个非常棒的回应。我想,在我们思考我们的社区和社会如何利用人工智能时,教育这部分对于人工智能生态系统的健康发展来说,似乎是一个非常关键的因素。教育非常重要。我很好奇,您能否进一步谈谈,一个健康的人工智能生态系统还有哪些关键因素或组成部分?开源是否在学术界发挥了作用?我很想更深入地探讨这个问题。
李飞飞:是的,我认为“生态系统”这个词本身就暗示着生态系统必须是多方利益相关者的协作。生态系统不仅仅局限于双赢,而是指在一个健康的生态系统中可能存在多方共赢的局面。以美国为例,尤其是在二战后,政府扮演了一个相对积极的角色,向公共部门和私营部门的生态系统注入资源,从而推动了技术创新和健康生态系统的发展。因此,我们今天看到的所有人工智能进展,从微芯片到互联网、大数据再到神经网络算法等一些基础性进展,都可以追溯到几十年的研究。因此拥有一个健康的生态系统是至关重要的,这不仅仅关乎资源的分配,更是指生态系统中的所有参与者都能共享和受益。
它还关乎人,对吧?一个健康的生态系统是人们接受教育、找到工作、并回馈生态系统的地方,这是一个至关重要的环节。我对此感到担忧,因为人工智能的发展速度太快了。现在,大部分资源不仅集中在私营生态系统中,而且实际上集中在极少数私营公司手中,这对创新和教育的整体生态系统,以及社会的长期健康发展都是不利的。
Hugo:因此,我更喜欢你从长期健康的角度来阐述这个问题。我非常好奇,你对人工智能的长期看法。例如,我们正处于人工智能的早期阶段,就像人类曾经处于利用电力的早期阶段,我们还没有灯泡,也还没有电网。我认为爱迪生建立创新实验室,就是为了弄清楚如何利用这些技术。因此,我们正处于那些早期阶段。我非常想知道,当我们回顾这个时代时,你认为人工智能会被视为像互联网或计算机、印刷术那样的东西,还是像火或文字那样更伟大的东西?
李飞飞:我认为人工智能是电力和计算机的结合体。首先,我认为人工智能是计算方式的创新。任何具有芯片的地方,无论是灯泡、飞机引擎、机器人还是冰箱,今天或明天任何具有芯片的地方,就具有计算。任何具有计算的地方,就会出现人工智能。从软件的角度来看,人工智能只是一种更智能的计算形式。因此,对我来说,这一点非常清楚。我称之为电力,因为它具有非常强的横向性。这种计算技术赋予了每个人。因此,它是一个我们社会应该提供的基础性基础设施,我们将密切关注其发展。现在还处于非常早期的阶段。过去只是私营公司和一些大学参与其中,但现在国家正在采取非常有力的措施进行资源投入,每个国家都有自己的政策,但这确实是自2022年底、2023年初以来最大的变化之一,即人工智能在政策领域受到的前所未有的关注。
Duncan:这太棒了。紧接着这个问题,您认为对于技术人员来说,在驾驭人工智能如此疯狂快速的发展过程中,哪些指导原则或经验法则最有用?
李飞飞:Duncan,我将从两个方面回答你的问题。从技术人员的角度,我深信,像我们这样接受过技术人员、科学家培训的人,我们的基本价值观是寻求真理,遵循事实。我们本身并非真理。我确实担心,作为人工智能技术人员,尤其是有幸拥有发言平台的人,有时我们会把自己看得太重,仿佛我们就是真理本身。我认为我们必须保持那种谦逊。我们接受训练是为了寻求真理,并在技术、科学和人性的面前尽可能保持谦逊,并忠于我们最初开始这项事业的原因。我开始这项事业是因为我是一个对世界如何运作、自然如何运作、智能如何运作充满好奇的青少年。然而,这至今仍在激励我,也让我保持谦卑。我认为这很重要,因为有时人工智能的炒作也会产生不必要的自负。
对于政策制定者,我实际上也曾发表过相关文章。我认为,我们可以遵循一些原则,深思熟虑地思考和行动,以应对人工智能。首先是科学,而非科幻小说。我真的非常担忧,当政策制定或政策制定者受到夸张的科幻故事或猜想的驱动,并据此制定政策甚至法律时。例如,一两年前,有许多关于人工智能导致人类灭绝的夸张言论。我实际上看到并感到不安的是,一些重要的全球政府会以此为前提发布政策,这是不健康的。我们需要非常尊重数据、测量结果和科学事实,这对于人工智能政策制定至关重要。
其次是实用主义,而非意识形态。我认为,一个最大的争论之一是,我们应该在多大程度上监管上游的NI研究,而不是下游的应用。我的确深信,总的来说,我们应该采取务实的方法,关注实际应用,并关注下游应用。如果我们担心医疗保健人工智能设备,那么我们就应该看看FDA对医疗设备的现有框架,并利用人工智能和新的人工智能知识对其进行更新,无论是金融、环境还是交通运输领域,我们都可以利用新的知识更新我们的监管框架,而不是扼杀上游的创新。这几乎等于说,汽车确实会致人死亡并造成伤害,但我们没有引入安全带和限速,而是在20世纪初关闭了所有汽车公司,重新使用马匹。这不是社会应该进步的方式。
最后但同样重要的是,在政策制定的框架内,我们已经明确提出了为生态系统提供资源,振兴生态系统的目标。这不仅是为了让大型企业蓬勃发展——这对每个人都至关重要,因为它们是大型雇主,是我们政府的重要纳税人——而且也要让企业家、公共部门和布斯凯大学的研究机构等各方蓬勃发展,因为这对社会的长期健康和发展具有深远的影响。
Hugo:我要感谢李飞飞,认为他为我们指明了建设更健康的人工智能生态系统的方向,这是一个非常精彩的想法。我也很喜欢汽车的例子。我们知道,安全带最初是为男性在试验中开发的,对吧?然后,我们开发了一个对每个人都更好的系统。但我认为这个例子确实说明了,在我们构建的系统中,我们需要以稳健和有原则的方式考虑所有不同的人和所有不同的利益相关者的实际需求,同时关注教育、开发者和开源生态系统,并且在政策层面努力提高公众对可能性的认识,揭开炒作的神秘面纱,以及哪些是行不通的。
节目时间差不多了,但非常感谢你,不仅是你过去几十年来所做并将继续做的工作,也感谢你慷慨地抽出时间与我们,以及我们的听众分享你的智慧和经验。因此,我们非常感激李飞飞。
李飞飞:感谢Hugo和Duncan,谢谢他们提出深思熟虑的问题。我非常享受与他们的交流。
Hugo:谢谢你,李飞飞。