说到这里,她又从包里取出了压缩之后的卷轴式电脑。
“科技越进步,技术背后的原理就会变得越难理解。前工业时代的技术,能通过简单的说明让任何人理解。而随着时代的推移,让研发者之外的人理解技术背后的原理,只会越来越难。我们在接触科技制品的时候,不会去追问背后的原理,只是使用它。如今的科技制品,就算去追问原理,也不是那么容易就能说清楚的。”
“就像这个卷轴式电脑一样,你不明白里面的原理,它对你来说是个 ‘黑箱’,但这并不妨碍你使用它。不过,至少有人明白里面的原理,对于全人类来说它仍具有可解释性。但是,那些使用了马里亚纳学习技术而产生的 ‘黑箱’却不是这样的。比如说出租车的自动驾驶功能、墓碑系统,还包括我开发的Pasithea和Hesiod系统。数据是如何在隐藏层里完成计算的,没有人知道,也无法解释,对于所有人来说它们都是 ‘黑箱’。”
“‘黑箱’化?”
“这样的 ‘黑箱’每天都在增加。”
“她会关注这个问题可能是出于某种焦虑。”艾玛说,“就像二十世纪,流水线上的工人被自动化设备取代,如今翻译的工作渐渐被软件取代,也许有一天我和莫妮卡的工作也会被机器取代,人工智能会代替人类来进行科学研究。所以她才会那么迫切地想要证明爱丁堡猜想,仿佛只要爱丁堡猜想能成立,人类就永远不会被机器取代一样。结果,她没有想到,自己的焦虑那么快就成真了,语言学会的人用墓碑系统审读了她的论文,那本该是由她的同行来完成的工作。莫妮卡是我见过的最纯粹的研究者。她也有最纯粹的求知欲,希望能尽可能地理解、阐释这个世界。可是,技术的发展方向和她理想中的科学是背道而驰的。包括我在内的很多学者所做的研究,也许只是在加剧世界的 ‘黑箱’化。”
“是啊。”艾玛一边肯定道,同时却摇了摇头,“但这还不算什么。毕竟退一步讲,最初的神经网络模型也好,训练数据也好,都是经过人为设计的。我们至少明白马里亚纳学习这门技术是怎么回事。可是以后会怎么样呢?如果到了某一天,人工智能代替人类来完成技术研发工作,而我们只需要从人工智能研发的技术里筛选出那些可以为人所用的,到了那个时候,所有的新技术我们只知道结论,而不会知道具体的原理,以及深埋在隐藏层里的研发过程——换言之,那些技术对于任何人来说都将是一个个 ‘黑箱’。”
莫妮卡也许是为了我才开始研究爱丁堡猜想的,而这个猜想耗尽了她的精力,最终把她逼上了绝路。
“那一天离我们还有多远呢?”
我想忍住溢出眼眶的泪水,却失败了。
“我不知道。也许十年,也许二十年。我只知道那一天迟早会来的。而且除了极少数的研究人员之外,不会有人察觉到有什么异样,因为我们早就习惯了日常生活里的 ‘黑箱’。毕竟,相比可解释性,更重要的是 ‘有用’。就像微积分,在弄清楚它的理论基础之前,数学家已经用了两百多年。因为它真的能派上用场。到了那个时候,也会有人想尽办法去解释那些 ‘黑箱’一般的技术,虽然解释可能永远也追不上 ‘黑箱’产生的速度。”
“不,她那个时候应该还没有开始研究。莫妮卡当时只是想安慰我,所以才提起了这个猜想。当时我问她,是不是技术再进步一些,我就会失去工作。她安慰我说有些句子机器会翻错,但人能通过直觉明白是什么意思,至少有这么一个假说……”
“莫妮卡也预见到了同样的未来吗?”
“她从那个时候就开始研究这个问题了吗?我从没听她提起过。”
“她对这些事情只会比我更敏感。”艾玛说,“而且,莫妮卡肯定不愿接受那样的未来。”
“我听她提起过爱丁堡猜想。八年前,在圣詹姆斯的那家小酒吧,当时你在旁边睡着了。”
艾玛把电脑放回包里,又从里面取出了那个已经褪色的SYNE,准备递给我,却又迟疑了一下,把手缩了回去。
“如果莫妮卡的论文能成立,这将成为爱丁堡猜想的一个弱证明。虽然Katchen-Sgouros完备空间只是比较特殊的一类语义向量空间,但是,一旦在这类空间里证明了这个结论,就有希望找到办法推广到所有的语义向量空间中去。换句话说,莫妮卡踏出了解决爱丁堡猜想的第一步。当然,前提是这个证明能成立……”
或许她是想把SYNE交给我保管,却又担心我在某天会选择和莫妮卡一样的死法,所以改变了主意。
说到这里,她忽然停顿了片刻,像是想到了更简单易懂的说明方式。
“你觉得莫妮卡为什么会以那种方式结束自己的生命呢?”她问我。恐怕,艾玛会根据这个问题的答案,来决定是否把那个SYNE交给我。
“她想证明,在有限维Katchen-Sgouros完备空间中,存在一个语义向量集具有Mikolov良序性,却不是Kobrin可测集。”艾玛解释道,“Mikolov良序性通俗点说,就意味着一句话是有意义的,并且强调的是在当前语境下有且仅有一种语义,不存在歧义。Kobrin测度是词义消歧的一种数学表达,除此之外还有好几种等价的表达方式,不过Kobrin测度只适用于Katchen-Sgouros完备空间……”
如果当时艾玛在酒吧里听到了我和莫妮卡的对话,或许就能明白这个问题的答案了吧,可惜她并没有听到。她不知道那句“Colorless green ideas sleep furiously”不仅是个生成语言学课本上的例子,也可以成为人生的隐喻——符合规律,遵守法则,却终究毫无意义的人生的隐喻。
“莫妮卡的论文到底写了什么?”
也许莫妮卡的那个SYNE也因为保存不当而褪去了颜色。当她看到原本是绿色,却褪色成透明的SYNE时,也想起了那个句子,然后想起我在酒后吐露的丧气话,最终想到了自己。但是这个答案太悲伤了。我不想让艾玛也感染上如此消极的情绪,所以必须为这个问题另想一个答案,一个错误但是能起到安慰作用的答案。
听到这里,我忽然有某种不祥的预感。
于是我回答说:
“她写这篇论文是想证明人工智能并不是万能的,它们至少在理论上存在能力的极限,甚至可以说是缺陷。为了证明这一点,她构建了一套全新的离散范畴理论,远比之前形式语义学界使用的数学工具更抽象,我可能需要一两年的时间才能完全掌握这套理论。但语言学会的人却只是让墓碑系统去检测了这篇论文之后,就彻底否定了它。这真的太讽刺了。自己的多年心血不仅被否定了,否定自己的竟然还不是同行,而是很可能并不完美的人工智能,明明这篇文章就是想论证人工智能的缺陷……”
“她只是喝下了自己的回忆——那些对于她来说最美好的回忆。”
“讽刺?”
参考文献
我屏住呼吸,等待她说下去,艾玛却一时陷入了沉默。
奥野陽 (著), グラム·ニュービッグ (著), 萩原正人 (著), 小町守 (監修) 「自然言語処理の基本と技術」翔泳社 2016
“我大概知道莫妮卡为什么会自杀了。”艾玛说,“可能她觉得太讽刺了。”
坪井祐太(著), 海野裕也 (著), 鈴木潤(著) 「深層学習による自然言語処理」講談社 2017
她收起电脑,却没有抬起头来。
笹野遼平 (著), 飯田龍 (著), 奥村学 (監修) 「文脈解析- 述語項構造·照応·談話構造の解析」コロナ社 2017
就在我们一起寻找来时乘坐的那辆出租车的时候,艾玛收到了伯明翰大学的人发来的邮件。一路上,她都在用卷轴电脑浏览那篇七百页的论文。我从旁边瞥了一眼,只看到了整页的公式。到了机场,艾玛又在候机厅读了一会儿,总算赶在登机的一小时前翻到了最后一页。
本文为《银河边缘》中文版专发篇目。
