“你知道吗,”我开始说道,“我当学生也不是太久以前的事,但那会儿,让计算机区分辨小猫和小狗都几乎还是科幻小说的情节。然后,深度学习在一夜之间改变了一切,我们的算法被用于我们曾经认为还需要几十年才能实现的领域。想想看,我们现在有多少人在谈论面部识别。记者、政客、活动家……突然之间,他们都提出了问题,而且都是好问题!这一切会导致更多的监控吗?会带来更有偏见的算法吗?甚至会导致人工智能武器的问世吗?一切都来得太快了。”
这个问题很好。尽管人工智能在过去十年中取得了不可思议的进展,但很多研究仍处于起步阶段。尤其是机器人技术,这项技术是出了名的难,即使在深度学习普及的时代,机器人技术的发展步伐也相对缓慢。在这样的时刻,以人为本的人工智能可能很难让人接受。
我们到了实验室。我在读卡器上刷了一下门卡,我们推开双扇门走了进去。
“我知道从理论上来讲,这些东西很重要。”他喝了一口咖啡,“但有什么用吗?飞飞,我的机器人还不能从烤面包机里拿出面包呢。研究本身就够让人沮丧的了,而且感觉每个人都在不停地发论文。我已经在担心下一次会议和它的截稿日期了!我的研究成果还非常初级,我到底应该拿出多少脑力去研究伦理问题呢?”
“我想说的是,”我总结道,“事情的变化可能会比你想象的要快得多。”
他指的是“计算机、伦理和公共政策”这门课,课程是由计算机科学家迈赫兰·萨哈米(Mehran Sahami)、政策学者杰里米·温斯坦(Jeremy Weinstein)和政治学家、伦理学家罗布·赖克共同开设的(赖克仍然是斯坦福HAI的创始贡献者之一)。我点了点头。
我知道我没有说服他,或者说没有完全说服他。虽然他心存疑虑,但还是很关注这个问题,一直在听我讲。愿意倾听就是一个好的起点。
“说实话吗?还没有。我肯定思考过这个问题,不想是不可能的。新闻上天天都在报这些事。我甚至还上了赖克教授的课。”
新入行的人产生怀疑情绪是很正常的。但在实验室里,以人为本的精神随处可见,白板上还留着前一天晚上的项目笔记,这个项目的目标是在保护信息所有者隐私的同时,利用敏感信息对神经网络进行训练;另一个类似的项目则是在不影响最终模型有效性的前提下,将图像数据集中的人脸进行模糊处理。
他叹了口气,抬头望着天空,耀眼的光彩正在渐渐褪去,天色傍晚。
我们甚至也开始用批判的眼光审视自己的研究成果。ImageNet包含了我们最初从互联网上搜罗的数百万张照片,我们通过研究,对数据集吸收的偏见(包括种族、性别和性取向)进行量化。在研究结果的指导下,我们替换了大量图片,以更加平衡地展现人类群体的全貌,并删除了具有冒犯性的类别标签。
“怎么样?”我报以微笑,“你觉得自己找到答案了吗?”
也许最鼓舞人心的——至少对我来说——是我们的工作从未如此贴近现实世界。一位初级研究员的机器夹不起吐司固然令人遗憾,但除此之外,这十年来,机器感知领域的复兴已经从根本上改变了机器人技术,现在已经很难将其与人工智能本身区分开来。仿佛是为了说明这一点,金属长凳上摆了两条光滑的机械手臂,它们的名字非常亲切,一个叫作“查理”,一个叫作“艾达”,正在耐心地等待下一次训练。如今,它们就像任何算法一样,已经成为我们实验室工作不可或缺的一部分。
“对,我还记得。”他微笑着回忆道,“我问你伦理和人工智能有什么关系。”
当然,硬件再先进、再亮眼,也只是达到目的的一种工具。因此,我们工作的指导原则依然关注人类的福祉,而不仅仅是追求程序的效率。这就是我们与数字经济实验室合作背后的理念。数字经济实验室是斯坦福HAI下属的成立不久的研究小组,这个小组利用美国劳动局的调查结果,以更好地了解人们对于自身工作价值的看法:他们在哪些方面欢迎自动化带来的便利,在哪些方面认为自动化的渗透具有威胁性,甚至是非人性化的。我首次意识到这种区别,是在跟阿尼一起研究环境智能的时候。我认识到,人工智能应始终致力于提高人类的能力,而不是与人类竞争。现在,这一理念成为我们实验室的基本价值观。这种价值观究竟意味着什么,这是每个研究人员都要自己回答的问题,但令人振奋的例子比比皆是。例如,我们实验室最重要的工作之一,就是对住宅、办公室和医院等日常空间进行极其细致的三维建模,而每个空间都有各种不同的种类、平面图和风格。我们努力让算法沉浸在人们生活和工作的环境中,沉浸在智能机器可能发挥最大作用的应用场景中,尤其是帮助身患疾病和残疾的人群。一个相关项目通过使用虚拟现实头盔和运动跟踪手套,帮助研究人员捕捉有形、有意义的任务(如叠衣服、准备食物等),并对动作进行数字编码,由此创建评估机器人性能的基准。还有一项研究探索了新的机器学习方法。研究人员设计出了具有天生好奇心的数字代理机器,并将其置于鼓励它们玩耍的虚拟环境中,因为玩耍是儿童与周围环境建立直觉联系的重要方式。
“嘿,你还记得几年前你第一天上课时问了我一个什么问题吗?我很好奇你是不是一直记得。”
每一个故事都代表着一个变化——我们对数据的看法发生了变化,对数据的期望也发生了变化。我们曾经试图给算法类似百科全书式的意识,希望算法可以识别所有的类别和事物,而现在,我们的目标更为广泛。我们想对万事万物所蕴含的空间、时间甚至意义有更深入的了解。我们的目标不仅仅是数量上的增加,还有细节和细微差别的扩展。新的数据处理方法不仅仅是简单的整理和编目,而是要模拟整个环境,模拟在环境中展开的行动。这就是为什么随着技术复杂性出现爆炸式增长,我们研究背后的人本主义也在不断发展。要形成对现实生活的整体观,为了创造比以往任何时候都更加真实的世界表征,我们需要深度和保真度,而在我看来,即使目前最先进的技术也达不到这种需求。因此,我们再次热血沸腾,迎接挑战。我们再次需要进化。
咖啡时间结束了,我和一个学生手里拿着带盖纸杯,走回实验室。
当然,进化的确切形式仍是个谜,但耐人寻味的蛛丝马迹已经初露端倪。随着进化所需的数据集规模日益增长,组织足够的人力所涉及的成本、时间甚至伦理问题不断增加。近年来,更具影响力的发展之一是出现了越来越多的模型训练新方法,这些方法可以突破人工整理数据集出现的瓶颈。模型的数据处理能力主要包括模型规模、并行操作的能力,以及自主识别有用模式的能力(文献中称之为“注意力”)等方面。模型在数据处理方面的进展使得用大规模数据集进行训练成为可能。有时,数据集的规模甚至构成了互联网的很大一部分。以文本为例,训练数据通常包括整个维基百科、各大图书馆的书籍和学术期刊,甚至是像Reddit这类在线论坛的历史帖子。在对每个单词、空格和标点符号进行分析之后,就可以生成人类语言的统计模型。这个模型是如此庞大,却又如此浓缩,只需要简短的提示,就可以让想法的种子变成茂密的参天大树,将一句话(无论是问句、陈述句还是对话)扩展成一篇洋洋洒洒的生动散文。这些模型现在通常被称为“大型语言模型”(Large Language Model,LLM),其所呈现的语句极为流畅,与人类的语言能力惊人地接近,让读者很容易忘记自己阅读的文字其实并不是真人写的。
环境智能很可能永远是我实验室的研究重点之一。每当我看到父母,就能想起为什么这项研究对我来说如此重要。正因为如此,即使是现在,我也会每天抽出时间来了解最新的实验、试验和监管动态。过去几年,人工智能领域在物体识别方面取得了许多突破,针对照片甚至视频生成的描述已与真人无异,发展速度之快令人窒息。然而,回顾过去,一条共同的主线越来越难以忽视:尽管技术非常先进复杂,但其本质都是被动观察;无论具体形式如何,其实都是算法在告诉我们它看到了什么。我们的模型学会了观察,有时观察得非常细致、非常准确,但也仅此而已。我最近常常思考,除此以外,一定还有什么更有意义的事情。
经过多年的计算机视觉研究突破,大型语言模型正在推动自然语言处理的复兴,也很可能预示着人工智能的下一个伟大时代即将来临。具体而言,一种称为Transformer的新型机器学习模型成为自2012年的AlexNet以来神经网络设计中最大的进化飞跃。Transformer具备了所有让大型语言模型成为可能的必要特性:规模庞大,通过处理大量并行数据块来加速训练,并拥有极其复杂的注意力机制。不管怎么看,Transformer都是一个里程碑,甚至可以说是一个转折点;它一经发布,就立刻展示出了惊人的能力,甚至连其背后的专家们都感到震惊,而这些进展至今都没有放缓。
我为这项工作深感自豪,但前路依然漫漫。就在《自然》杂志发表这篇论文的几个月后,12月份的《柳叶刀》(TheLancet)杂志发表了一篇题为《在医疗机构中使用环境智能的伦理问题》的反驳文章。这篇文章直言不讳、推理透彻,对我们工作的意义进行了公正而严谨的审视。用作者的话来说,环境智能在提升医疗服务水平方面的潜力与“一系列伦理问题”同时存在,其中很多问题涉及大规模的数据收集和新的隐私隐患等方面。文章还进行了更深入的哲学探讨:在这种沉浸式、分散监控技术的环境中,知情同意的本质究竟是什么?虽然读到对自己研究成果的评论文章总会让人心里颇不是滋味,但这篇文章中呈现的正是人工智能所需要的伦理论述,我对其中的大部分内容深表赞同。
初次接触到由大型语言模型生成的文本时,我感到非常超现实,不禁想起了当年与安德烈合作开展的研究。当时,我们看到人工智能写出一个完整的句子来描述自己看到的东西(尽管措辞略显笨拙),是多么兴奋啊。而仅仅几年后,算法已经成为文笔流畅的文字大师,可以回答问题、编写故事,甚至还能解释笑话。更重要的是,新兴的“多模态”网络不仅限于在文本上进行训练,还可以利用照片、音频、录音甚至视频进行训练,从而学会了生成不同形式的媒体内容。这种进展常常让人感觉比计划提前了一两代;在短短十年左右的时间里,算法已经从难以识别照片内容,发展到以超人水平进行识别,现在甚至可以创造全新的图片——这些图片看起来跟真实的摄影作品无异,但完全是合成的,并且往往具有惊人的逼真度和细节。看起来,深度学习时代似乎已经让位于一场新的革命,生成式人工智能时代即将来临。
论文描述了环境智能在医院的各个场景中可以发挥的作用,包括改善老年人护理、协助慢性疾病管理、识别精神疾病症状、在整个手术过程中跟踪手术工具的使用、在整个轮班过程中提高临床医生的卫生状况等等。论文没有发表在专注于计算机科学、人工智能或信息处理的期刊上,而是登上了《自然》杂志——这也许是整个科学领域最杰出的一大期刊。这提醒我们,最好的研究往往不是在我们各自领域的象牙塔中孤立完成的,而是在科学的整体共享空间中实现的,研究人员应该毫不犹豫地在全球范围内展开跨学科合作。
即使对我来说,生成式人工智能也经常看起来就像魔法一样。而这项技术的核心再次展现了大规模数据的力量。可以肯定的是,“规模”是其中的关键词。AlexNet首次亮相时,网络参数为6000万个,刚好足以对ImageNet数据集进行合理解释,至少可以解释部分子集。相比之下,Transformer的参数已经增长到数千亿个,足以利用文本、照片、视频等形式的数据进行训练。这无疑带来了无尽的工程挑战,但其中所体现的科学性却出奇的优雅。从杨立昆的邮编阅读器、福岛的新认知机,甚至罗森布拉特的感知机时代开始,这些可能性似乎就一直在等待着我们的发现。从ImageNet时代开始,所有这一切都存在于某个地方,蕴藏着巨大的潜力。我们要做的,只是把一个简单的想法变得足够宏大而已。
2020年9月,在距离我们初次对话近十年后,我和阿尼发表了题为《用环境智能照亮医疗保健的黑暗空间》的论文,对我们的研究进行了全面的回顾,并介绍了我们对智能传感器的完整构想。智能传感器可以扩展医生和护士的感知范围,帮助他们以前所未有的规模和一致性应对医疗保健环境中的混乱状况。
然而,我越来越感觉到,这样的解释只触及了技术细节,并没有回答更本质的问题。大型语言模型,即使是多模态的大型语言模型,可能也并不具备真正意义上的“思考”能力。看看就知道了:大型语言模型很容易出现荒谬的概念性失误,也乐于编造听起来合理但实际上毫无意义的胡言乱语。了解这些事实有助于我们避免过分迷恋模型的能力。然而,随着大型语言模型生成的文本、图像、语音和视频越来越复杂,真与假之间的界限愈加模糊。越来越多的评论家开始质疑,为我们敲响警钟:作为个人、机构,甚至社会,我们究竟有没有能力区分真实和虚构?当人们意识到这一切还只是1.0版本时,这种发问尤其令人警醒。
两年前,国家研究云平台还只是个想法而已。如果没有斯坦福HAI,它可能会永远停留在理念的层面。斯坦福HAI包括了法律和公共政策专家的多元化团队把这一概念变为使命。特别是约翰,他利用自己职业生涯累积的宝贵人脉资源,招募全国各地的大学组成联盟,这是我在学术界见过的最了不起的联盟。经过了一系列的思想交流、建议磋商、跨国飞行和理性辩论,他很快就形成了完备的立法蓝图,并将其提交给了国会。要使人工智能成为真正具有包容性的追求,我们还有很长的路要走,但国家研究云平台这样的成就是朝着正确方向迈出的重要步伐。
就这样,科技不断发展。算法语言表达的高级程度已逼近人类水平。机器人正在逐渐学会应对真实的环境。视觉模型不仅可以通过照片进行训练,还可以在全三维世界中进行沉浸式实时训练。人工智能能够像识别内容一样流畅地生成内容。与此同时,伦理问题在我们周围不断涌现,与人类经济社会发展的关联也日益紧密。但这就是科学一直以来的样子。随着旅程的展开,前路只会变得更漫长、更复杂。无穷无尽的分叉、不断扩大的视野、新的发现、新的危机、新的争论,故事永远处于第一幕。
在我们的合作成果中,我个人最喜欢的是国家研究云计划(National Research Cloud,NRC)。国家研究云是一个完全由公共资金和资源(而非营利部门)支持的共享人工智能开发平台,目标是让全世界的学者、初创企业、非政府组织和政府都能开展人工智能研究,从而确保我们的领域不会永远被科技巨头或者我们这样的大学所垄断。
曾经,我做出决定,要把自己的一生奉献给这个鲜为人知的领域;因为这个决定,我比想象中走得更远。因为历史的偶然,我这一代人亲眼见证了人工智能从学术奥秘转变为头条新闻。我因此有机会周游世界,与全球的领导者同聚一堂,并在最近几年中站在最大的平台上发表演讲。耀眼的灯光、绚丽的色彩、一排排的观众似乎可以无限延伸到地平线,这些都是难得的特权,每一个都是意想不到的荣誉。
很多合作都改变了我对未来可能性的思考,其中一次合作尤其重要。十年前,我第一次见到约翰·埃切门迪,当时他还是大学教务长,而我则是来自东海岸的移民,正痴迷于尚未完成的ImageNet。在接下来的几年里,我们成了邻居和朋友,我对他作为学者的深厚学识也愈加敬佩。不仅如此,在多年的管理生涯中,约翰对高等教育领域的内部运作方式(好的、坏的,甚至是卡夫卡式的)也积累了丰富的专业知识。他完全知道如何才能把斯坦福HAI那些看似不太可能实现的愿景变为现实。对于以人为本的人工智能,他不只是嘴上讲讲,也不只是宣扬其优点,而是要一砖一瓦地倾心构建。因此,当他同意担任斯坦福HAI的联合主任,与我并肩作战时,我知道我们的确有机会让研究院取得成功。
但实验室仍然是我最喜欢的地方:荧光灯管嗡嗡作响,座椅硬邦邦的,咖啡早就不新鲜了,没完没了地点鼠标、敲键盘,记号笔在白板上发出吱吱声。自从2012年AlexNet诞生,自从2006年我和邓嘉创建ImageNet,自从彼得罗把西蒙·索普的脑电图研究报告打印稿放在我桌上,发生了太多事情。“相信我,这是你想读的内容。”即使是现在,北极星依然照耀着我前行的道路。旅程仍在召唤,还有更多的目标等待我去追逐。
斯坦福大学的计算机科学院系属于美国最早的一批计算机院系之一,能在其核心成立一个明确的人本主义组织,其象征意义令我倍感振奋。斯坦福HAI目标远大,旨在成为跨学科合作中心。这种雄心并非停留在诗意的愿景上,而是已经成为现实。在日常的任意一天,我都很可能遇到像斯坦福大学法学院的何恩文(Dan Ho)、政治学教授罗布·赖克(Rob Reich)、人文学科教授米歇尔·伊拉姆(Michele Elam),或者从弦理论物理学家转行成为计算神经科学家的苏里亚·甘古利(Surya Ganguli)这样的人物。他们都欣然同意成为斯坦福HAI的一员,直接与人工智能专业的学生和研究人员合作,探索我们领域之间的交叉点,分享他们在职业生涯和生活中积累的专业知识。我们甚至吸引了来自校外的合作伙伴,包括麻省理工学院的著名经济学家埃里克·布林约尔松(Erik Brynjolfsson)。他横跨美国,来到斯坦福大学,就是为了帮助斯坦福HAI更好地理解人工智能对就业、财富和现代世界权力集中的影响。有时,我感觉整个学科似乎正在重生,其活力水平甚至超出了我几年前的想象。
我时常回想起与彼得罗和克里斯托夫初次见面的情景,当时他们在我心中就是学术巨人。我很难想象有人会把我也看成是那样的人——单凭我的身材,就可能让我失去“巨人”的资格。但在某种程度上,我确实有一点儿权威人物的气场。我的导师们教会了我如何善用威严:要将其作为一种感召,而不是障碍。对于每一个愿意通过个人努力来到这里的学生,我想告诉你们:如果你真的对这些事物充满热情,无论你是谁,无论你来自哪里,你都属于这里。让我们共同创造未来!
盖茨计算机科学大楼给我的感觉既宏伟又内敛。大厅里天花板高耸,地面上铺着大理石,像博物馆一样回响,拱形剧院大小的教室恰如其分地向思想的力量致敬。但我最熟悉的是楼上狭窄的走廊,这里就是我的实验室和斯坦福大学人工智能实验室的所在地。现在,大楼的一层翻新翼楼有了新的变化,成了斯坦福大学以人为本人工智能研究院(Stanford Institute for Human-Centered Artificial Intelligence,简称“斯坦福HAI”)的总部。
午后阳光明媚,太阳渐渐西斜,但空气依然暖和,我们躲在凉亭的树荫下,享受着宁静的时刻。母亲静静地坐着,满心欢喜地看着外孙外孙女在草坪上踢足球,他们奔跑着,笑声、尖叫声回荡。父亲尽力跟上他们的脚步,和他们一起欢笑,看着就像个年轻人。对以“玩”为毕生追求的父亲来说,成为外祖父后,他终于找到了适合自己的节奏——这个角色对他没有任何要求,他只需要做爱玩的自己就好。
“嗯……”学生挠了挠头,“听起来很有意思,只是我没想到会在这样的课堂上听到。我很好奇,伦理、社会与编写代码之类的工作有什么关系呢?”
手机震动,我低头看了一眼,发现是斯坦福HAI的政策主管发来的信息。
“以人为本。”我笑着回答,“至少,我认为是这样。具体名称我还在想。”
国家研究云刚刚在参议院获得通过
“您是说,以人为中心的人工智能?”
这是一个更大法案的一部分
“我确实有一些新想法。它们还处于早期阶段,不过我对此持乐观态度。事实上,我刚在一分钟前提到过。”
即将提交总统
当然,这就是本科生的魅力所在。他们往往是笨嘴拙舌,但却非常善于开门见山。我本来想分享一些我的实验室正在研究的想法,但在最后一刻改变了主意。
一分钟后,我又收到一条信息,是琼·萨贝拉发来的,还附带了一段视频。我点击播放按钮,看到两双热切的小手撕开了配套的包装纸,露出两套《星球大战》乐高套装,我听到了兴奋的尖叫声。
哎哟。良好的自我感觉到此为止。
“孩子们,你们应该说什么呢?”我听到琼在镜头外问道,“谢谢飞飞阿姨和西尔维奥叔叔!”两个声音高兴地齐声回答。
“我想知道,从那以后您有过什么别的想法吗?”
镜头里是鲍勃的两个孙子。他的书呆子气和想象力显然延续到了他的孙辈身上。但两个小家伙毫无掩饰的喜悦告诉我,鲍勃的内向性格已经消失无踪。我能想象到,如果鲍勃听到这样的话,脸上会露出怎样的笑容。
“我得到了很多帮助,但没错,是我做的。”我笑着说。获得知名度从来不是投身科学的好理由,但来自他人的积极反馈总是让人感到欣慰。
挂断视频后,我回到了群聊,里面有琼、她的儿子马克,还有我。几年来,我们在群里分享着个人的生活和成就:重要的里程碑、生日庆祝、膝关节置换手术后的恢复情况、新工作、新宠物、喜悦的消息、悲伤的消息,以及生命岁月中的点点滴滴。
“ImageNet是您做的,对吗?”
在帕西帕尼高中的数学课上,我不安地向鲍勃求助,从此我们的生命开始相交,我的移民生活得以改变。现在,我们两个家庭横跨美国,三代人之间依然保持着紧密的联系。鲍勃是我的老师、我的知己、我的朋友;在我几乎无法表达自己的时候,他是我的救命稻草。萨贝拉一家的餐桌上总是摆着自制的布朗尼蛋糕,时至今日,这仍是我受到过最好的同理心教育。萨贝拉一家无疑是我自己家庭的延伸。我无法想象没有他们的生活,就像我无法想象没有父母的生活一样。这就是为什么十多年后,鲍勃的离去仍然让我感到心痛。但我们的对话从未停止过,他的记忆仍在倾听,我仍在向他倾吐心声。
“我也觉得深度学习非常激动人心!你选择了一个很棒的领域。”
关于这个国家,让我学到最多的就是与萨贝拉一家的交往。爱国主义教育从高中就开始了,历史课上的宏大叙事令人崇敬,却与移民群体真实生活的凄凉现状,甚至遭受的暴力形成了鲜明对比,所以这些课程从来没有真正触及我的内心深处。几十年来,我和其他人一样沉浸在紧张的局势中,面临党派纷争、文化断层、选举周期以及其他一切。我对这个国家最深刻的理解不是来自新闻,也不是来自某个论战家的专栏文章,甚至不是来自教科书,而是源于有幸结识萨贝拉一家。他们是我在这片土地上最珍视的人道主义典范,他们闪耀着人性的光辉,在我看来,这才是真正的美国精神。
“您好,李教授。”一个学生走到队伍前面时,向我问好,“我对深度学习特别感兴趣。我已经读了所有我能找到的书。”
推拉玻璃门发出橡胶摩擦般的吱吱声,我转过身来。西尔维奥朝我们走来,手里空空如也。
下课后,学生们排起了队,来询问后续问题——课程的第一天通常会是这样。长长的队伍从教室前方的讲台一直蜿蜒到了后墙。
“午餐呢?”我半开玩笑地问道,肚子已经饿得咕咕叫了。
“以人为本的人工智能。”这个词我琢磨了好几个月,现在终于说了出来,“我一直这样表述自己的理念。我希望这个词能恰如其分地诠释我今后的职业生涯。我希望在未来的岁月里,‘以人为本的人工智能’对你们所有人都能有一定的意义。”
“答辩进行了很长时间。”他叹了口气,露出毫无歉意的微笑。他知道,我既能分享他的快乐,也能理解他的疲惫。
这并不是我事先准备的最周全的时刻,一些听众可能会觉得有点意外。但我的话都发自内心,我也知道,这不会是我最后一次谈论相关问题。
在过去的几个小时里,他在仔细剖析他最新的博士候选人的论文,质疑她的观点,听取她的解释,并最终授予她学位。不难想象,整个过程远远超出了预定的时间,西尔维奥被那种熟悉的激情紧紧抓住了。我们两个都是这样,一旦激情沸腾,就会久久难以平息。
我高声说道:“无论是解决数据中的偏见,还是保护医院里的病人,这一切的共同点是我们的技术如何对待人,尤其是如何保护个体的尊严。‘尊严’,这是我一直强调的关键词。最重要的问题就是,人工智能如何才能尊重人的尊严呢?这个问题是一切研究工作的立足点。”
我又看了一眼手机,发消息的都是熟悉的名字。最近的聊天记录里有奥尔佳和邓嘉,两人现在都在普林斯顿大学任教,依然活跃在计算机视觉研究的最前沿。尤其是奥尔佳,她是人工智能领域公平和透明的坚定倡导者,还把AI4ALL带到了自己的新校园。仍在加州理工学院任教的彼得罗也给我发来了信息,向我介绍他的博士生利用计算机视觉支持全球保护和可持续发展的工作。还有一条来自我十几年来的研究伙伴和朋友阿尼,他跟我分享了环境智能的最新进展。
我必须承认,自从我上次在大学授课以来,人工智能行业已经发生了翻天覆地的变化。在此期间的几年里,我亲眼见证了太多事情。我看到了谷歌的会议室,巨大的数据中心如仓库般大小;我走进过医院,也曾在华盛顿特区的街道上忐忑不安地穿行。现在,人工智能依然是我最热爱的科学,不过它已经超越了纯粹的科学范畴。无论这些学生将来会成为研究人员、产品设计师、企业高管、政策制定者,还是从事其他我无法想象的职业,他们都将继承巨大的责任。
无论我如何界定自己的身份——是华人、美国人,还是名誉上的意大利人——我早已摆脱了对“格格不入”的恐惧,因为我一路上遇到太多真诚的人,他们给了我太多善意。移民之路并不平坦,但我始终心存感激。
对于在场的许多人来说,今天是他们第一次接触到我钟爱已久的思想,而我也有幸成为传递者。跟随鲍勃(当时我还称他为萨贝拉先生)学习的经历依然历历在目,它提醒着我,一位老师可以在年轻人的生命中留下无比深刻的烙印。我们被赋予了分享一种特殊喜悦的权利:学习知识的快感、新的可能性带来的冲击。当然,这种感觉不会持久,因为学习的喜悦最终会因为职业发展、出版要求、求职面试,甚至风险投资和收入预测而变得复杂。但在眼下的时光里,思想才是唯一重要的事。也许礼堂里的一些人即将发现自己有了值得追寻的目标。
即使是母亲持续多年的健康问题,也不能简单地用幸运与不幸来衡量,其背后的故事要复杂得多。不可避免的事情还能拖延多久,才能让人觉得不再那么不可避免?近30年的旅程虽然坎坷,但我不得不承认,以不幸家庭的标准来看,我们家是幸运的。生活虽然艰辛,但我们并没有失去亲人,没有经历悲伤和哀悼,我们在一起度过了所有的时光,我不禁对此也深怀感恩。
站在讲台上,我想起了在普林斯顿大学读大一时的情景,当时我怀着敬畏之情第一次进入拥挤的礼堂,匆忙寻找座位。我还记得,我的内心充满了期待,当闲聊声逐渐消散,教授出现时,他仿佛超人一般瞬间征服了全班同学。如今,我成了站在讲台上的那个人,而现在我才意识到,原来我们都是彻头彻尾的普通人。我们也许略有成就,但依然有弱点,依然会犯错,而犯错的方式是学生时代的我无法想象的。不管怎样,课堂对我来说仍然是具有特殊意义的场所,而这样的时刻让我热血沸腾。
这些天来,我发现自己时常陷入沉思。我经常想起父母的成长岁月,母亲被困在自我吞噬的文化中,而父亲则迷失在悲剧里,从来没有完全解脱。我还记得,当我们登上飞机离开我们熟悉的生活时,我看到母亲的双手颤抖不止;当我们在肯尼迪机场行李提取处等待时,夜幕降临,我和母亲被困机场,父亲却迟迟未到,我们的内心充满了恐惧;我想起干洗店里闷热的气息和嗡嗡的机械声;我想起第一次看到普林斯顿大学的情景。
英伟达礼堂灯光柔和而中性,却充满了活力。礼堂里座无虚席,求知若渴的学生们有的坐在地板上,有的坐在楼梯上,还有的背靠后墙,双腿交叉,膝上放着笔记本电脑。此外,还有数百人在远程加入课堂,总人数有600左右。那是2019年的春天,是“CS231n:卷积神经网络视觉识别”课程开设的第三年,选课人数呈爆炸式增长。这门课很快就成了我最喜欢教授的课程。
回顾我的职业生涯,我相信,这段漂洋过海的经历给我留下了深刻的烙印。然而,直到现在我才意识到,这种烙印将继续影响我的研究和思考。我想到母亲,是什么样的紧张局势促使她孤注一掷、远走他乡?而如今,她竟然在位于帕洛阿尔托的自家后院里安度晚年。科学家的生活与移民的生活和冒险家的生活一样,对他们来说,“家”从来都不是个明确的概念。最好的作品总是在边界上诞生,在那里,思想永远被困在来去之间,由陌生土地上的陌生人探索,既是局内人又是局外人。但这正是我们如此强大的原因。独特的身份让我们保持独特的视角,赋予我们自由挑战现状的能力。
再次回到讲台上的感觉真好。
人工智能的未来仍然充满不确定性,我们有很多理由保持乐观,也同样有很多理由感到担忧。但一切都源于比单纯的技术更深层次、更有影响的问题:在我们创造的过程中,是什么在激励着我们的心灵和思想?我相信,这个问题的答案也许比其他任何问题的答案都更能决定我们的未来。很多事情都取决于问题由谁来回答。随着人工智能领域逐渐变得更加多元、更加包容、对其他学科的专业知识更加开放,我也越来越有信心:我们能正确回答这个问题。
人工智能的未来仍然充满不确定性,我们有很多理由保持乐观,也同样有很多理由感到担忧。但一切都源于比单纯的技术更深层次、更有影响的问题:在我们创造的过程中,是什么在激励着我们的心灵和思想?
在现实世界中,存在着一颗北极星,那是小熊星座中最明亮的恒星。而在思想的世界里,却存在无数个类似的导航指引。每一种新的追求,每一个新的痴迷,都悬挂在黑暗的地平线上,闪烁着耀眼的光芒,向不懈追寻的人们招手致意。这就是为什么我最大的快乐在于知道旅程永远不会结束,我也永远不会停歇。总会有新的事物等着我去追逐探索。对科学家而言,想象力就如同布满北极星的璀璨天空。
The Next North Star