大悟读书网 > 经济管理 > 人工智能革命:历史、当下与未来 > 学习、归纳与推理 ——这才是人工智能

学习、归纳与推理 ——这才是人工智能

当莱特兄弟和其他先驱者停止模仿鸟类并开始学习空气动力学时,对人工飞行的追求才开始走向成功,对通用智能的追求过程同样如此。人工智能不需要将重点放到模仿大脑的生物过程上,而应该尝试理解大脑所处理的问题。可以合理地估计,人类使用了任意数量的技术进行学习,而不管学习在生物学层面上的实现方式。对通用人工智能来说也是一样:它将使用穷举搜索树,它将使用基于规则的系统,它也将使用模式匹配。但不管使用什么,它在处事方式上应该像个人类,而非仅仅说出一些似是而非的“人话”。

如何从狭窄的特定领域智能迈向更通用的智能?这里的“通用”意味着机器能在没有编码特定领域知识的情况下解决不同种类的问题。作为人类,我们希望机器能够像我们一样进行判断与决策,而非限于在规则的框架内给出解释性的回答。通用智能应当具备处理多种类型的任务和适应未曾预料的情形的能力,例如,它无疑可以实现“正义”和“公平”这样的概念:事实上,人工智能对法律系统的影响已经近在眼前。

通用人工智能(Artificial General Intelligence)由德国计算机科学家马库斯·胡特(Marcus Hutter)提出,他对这一概念给出了精当的定义:

相比之下,计算机在很多事情上都显示出其“笨拙”。在安静的环境中,语音识别的准确率已经可以达到90%,但是在存在方言、噪音、远场等问题的实际环境下,其准确率就会不忍直视。最常见的例子就是鸡尾酒问题。在酒会上,即使周围十分嘈杂,有许多人同时交谈,人仍然能够顺利地分辨出和我交谈的那个人的声音,机器的语音识别算法在这样的场景下则基本等同于聋子。

智能是主体在各种各样的纷繁复杂的环境中实现目标的能力。

当然,人脑不仅仅是个针对刺激产生反应的简单系统,其内生性活动的强度甚至高于反应性活动,人脑在所谓的静息状态下的耗氧量与任务状态下相比差别很小这一事实也验证了以上观点。遗憾的是,由于内生性活动无论是定性观察还是定量观察都非常困难,导致其被长期排除在认知科学的研究主流之外。随着脑成像技术的发展,功能连接成为分析静息态大脑自发活动的有力工具。特别是默认网络的发现,创立了强调内生性活动的全新脑功能成像研究范式。默认网络被认为涉及警觉状态、自我意识、注意调控以及学习记忆等心理认知过程,已被广泛应用于社会认知、自我、注意、学习、发育、衰老机制的研究,有力推动了各种脑生物指标的完善和脑疾病的治疗,这些疾病包括阿尔兹海默病、帕金森病、抑郁症、精神分裂症和自闭症等等。

把这一概念翻译成计算机能够理解的语言,得到的结果就是通用归纳模型和序贯决策理论的结合。通用归纳将归纳转化为预测,而预测的关键是对数据的建模或编码表示,预测的精度依赖于对模式的掌握程度。诸如分类、类比、联想、泛化等与智能相关的要素,都可以被广义地理解为对模式的追求,对计算机而言则是找寻最优编码。但找寻最优编码的过程无法通过解析方式执行,只能通过试错不断逼近。

选择性注意机制的生理学基础是模块化的层次结构和分布式表征。功能模块化假设认为,大脑是由结构和功能相对独立、专司特定认知功能的多个脑区组成。这些模块组成复杂的层次结构,通过层次间的传递和反馈实现对输入信号的主动调节。大量脑成像的研究实验也支持了这一假设,特别是视觉研究发现了非常详细而复杂的功能模块及其层次结构。另一方面,分布式表征的假说认为,认知功能的神经机制是相对大范围的分布式脑状态,而不是特定脑区的激活与否。

试错的实质就是序贯决策理论,它研究的是在客观概率分布已知但具体状态不确定的动态环境中,主体如何寻求最大化期望效用。它从初始状态开始,每个时刻根据所观察到的状态和以前状态的记录,依照已知的概率分布,从一组可行方案中选用一个能够获得最大化期望效用的最优方案,接着观察下一步实际出现的状态,然后再作出新的最优决策,如此反复进行。但最关键的问题是,如果这种客观的概率分布未知怎么办?

正因如此,物理世界中的不同信息在精神世界中具有不同的权重也就理所当然。体积相对较小的手指、舌头等重点区域占据着感觉运动中枢里的大部分皮层,在视觉上也只有对应中央视野的视网膜具有较高的空间分辨率和颜色分辨率,而更广泛的外周视野只对外界物体的突变敏感。人类正是通过知觉组织的选择性注意机制,直接感知输入信号中的大尺度不变性质,而忽略大量的局部的小尺度特征,其生态意义就在于对知觉对象进行信息抽提。

建立了未知概率分布下的决策体系,就建立了通用人工智能,这也正是“算法概率”的宗旨与要义。算法概率的含义比较复杂,对这一概念的探讨已超出了本书的范围。但简而言之,其核心是用可控的主观概率代替未知的客观概率,不同的主观概率则来源于对描述客观世界的不同算法的反向推演。如此一来,归纳是一个不断试错的学习过程,算法概率使得我们可以根据经验不断修正信念、逼近真实的客观概率,再借助序贯决策理论帮助我们追逐效用,能够自动适应各种可能环境的超级智能体就横空出世了。

单纯的信息提取对计算机而言可能只是小菜一碟,但人类经过了千万年的进化,要复制这久经考验而形成的智能水准现在看来还是路漫漫其修远兮。计算机和人脑的运行规则显然是两个相差甚远的范式。目的在于提取信息的人类智能本就不求在精神世界里客观准确地再现物理世界,其终极目标是“生存”:用最合理的代价,获取最大的生存优势。

通用智能在指明人工智能发展方向的同时,也给人工智能的水平设置了上界。如果现实世界没有那么纷繁复杂——或许现实世界真的没有想象中那么纷繁复杂,一个简单的幂律分布就能在各种尺度上各种环境中支配着各种看上去不相干的现象;或者某些复杂的模式可能是存在的,但某些可计算但异常复杂的模式可能不过是我们数学上的抽象构造,未必真的都会被物理例示——那么,算法概率就可以迅速地收敛到真实的现实世界,某个可计算且足够强大能适应足够复杂的环境的智能体也可能不难找到;但如果现实世界确实包含高复杂度的各种可能的模式,那么,简单的数学理论就无能为力了。

创造出像你我一样具有自我意识和思考的人工智能无疑是世界上最具挑战性的问题之一,新的存在总是想窥探造物主的秘密。事实上,这也是达特茅斯会议的初心所在。可眼下,主流人工智能界已变得越发谨慎,目标也开始转移到针对某类特殊问题、特殊功能、特殊领域设计算法问题求解。在坚持传统的研究者看来,人工智能早已进入“脑死亡”的状态。

长久以来,通用智能概念的创始人胡特如一个特立的苦行僧,在熙熙攘攘的人工智能领域踽踽独行。在这个各路算法大行其道的狂欢时代,对终极问题的思辨与追寻反而显得格格不入。