大悟读书网 > 经济管理 > 人工智能革命:历史、当下与未来 > 熟悉的麻木 ——人类智能有多强大

熟悉的麻木 ——人类智能有多强大

隐含在验证码背后的是关于人类认知的迷人话题:当物体的视觉信息经过视网膜和外膝体之后,会在注意环路的调节和控制下被初级和高级视觉皮层完成逐级的表征和加工过程,从而引导大脑发现物体自身醒目的特征和需要提前注意的特征。如果对面是一张人脸,在感知、区分和识别的过程中,我们会先后实现如下的判断“是人脸还是桌子?”“这个人我认识吗?他叫什么?在哪工作?”等过程,之后,记忆系统还会进一步完成一系列的高级加工:再认和回忆——某时某刻我在某地见过他、语义判断——他的名字有什么特殊的含义、以及情绪加工——这个人看起来绝非善类,我不喜欢他。

图2-1 典型的验证码图片

所有这些认知都可以归结为一个高度抽象化的加工模型。在这个模型中,信息的加工具有从简单到复杂的层次化特征,在每个层次上都有相应的表征,提取从线段朝向、简单特征组合到复杂特征等不同的特征,感知、识别等认知加工也是由这些不同表征的组合完成的。表征和加工的物质基础是神经元,大量神经元构成的群体的同步活动是实现表征和加工的生理学机制。单个神经元只能表征极为简单的信息,但当它们通过神经电活动有节律的同步震荡整合在一起时,复杂的功能就诞生了。从信息科学的角度看,整个加工过程的实现可以理解为复杂的多次特征提取过程,提取的特征从简单到复杂,多次组合,甚至“概念”这种十分抽象的特征也可以被提取。

但如果人类的认知过程只是提取当前信息的特征并进行分类这么简单的话,它可不值得如此大费笔墨——认知还和注意、情绪等系统有着极强的交互作用,这些功能和认知密切相关。人的情绪对认知的影响绝非中晚期才启动的高级过程,它的作用远比我们想象的多。焦虑症、抑郁症等情感疾病的患者与正常人相比,对负性情绪信息有注意偏向,对带有负面色彩的情绪刺激更容易关注,这种注意偏向发生在视觉感知的早期阶段,其机理至今还笼罩在迷雾之中。

在验证码中,字母和数字被嵌入杂乱无章的场景之下,灰度也被仔细调整,人为加入的各种噪声则让画面看起来更随机;为了防止根据频域特征识别,场景中还会加入线条等元素以破坏图像的大尺度特征。虽然从统计特性上看,噪声和目标字符没有差别,但是这些元素组合在一起显然导致了质变。这质变对人而言无关痛痒——在这类复杂的场景中正确地分割和识别出物体是小菜一碟。虽然场景中的颜色、形状、朝向千变万化,各不相同,互相遮挡程度很深,甚至有些物体的背景都在运动,但这些特点丝毫不会影响识别的准确性,视觉功能正常的人做这类任务的准确率几乎是100%,这突出地体现出人类视觉和计算机视觉的之间的差异。这一技术目前被互联网网站广泛应用,着实是对计算机视觉无声的嘲讽。

从生理角度上讲,认知过程中不同的加工是由大脑的不同区域实现的,这些区域并非各自为战,大部分情况下会协同工作。这种类似多重备份的机制的优势在于大脑的部分区域出现功能丧失时,不会导致识别功能完全瘫痪。在神经外科中经常出现令人称奇的病例:一位小脑完全缺失的患者竟然可以长期存活,她的不正常表现仅仅是走路不稳和轻微的发音不清;另一位患者大脑中连接两个最重要的语言区的弓状束纤维受到肿瘤压迫,这让她无法说出呈现在眼前的钥匙的名称,但是能明确描述出它是用来开门的,还亲手操作用法,情急脱口而出说这是瓶起子。某些脑区的缺失不但不会影响存活,甚至对正常生活的影响也远非我们想象中那般严重,这不得不说是进化的奇迹。

对这一事实最有力的说明就是验证码的应用:几乎所有的网站都要求你在注册时辨认并输入一串扭曲的字符,其目的在于证明服务器另一端的你是人类而非机器。这串简单的字符却有着冗长的学名:全自动区分计算机和人类的图灵测试,英文缩写为CAPTCHA——也就是通常所说的验证码。验证码的出现恰是人类智能绝妙的体现:识字的小朋友都能完成的任务,迄今为止却没有任何计算机算法能够做到。

我们作为人类足以引以为傲的还不止于此。我们能够自由地控制四肢和身体,这同样是工程学上的卓越成就。人类的双手可称得上终极进化版瑞士军刀,在大脑的精确控制下能够执行几十种相当于卡盘、握把、夹具和钩子的功能。双腿亦是如此:这是真正意义上的全路况交通工具,它帮助我们征服了地球上从陡峭的山坡到崎岖的深谷的各个角落。站立、行走、奔跑、跳跃——在大脑的支配下双腿可以完成无比复杂的动作。目前,售价几千元的扫地机器人既爬不出地毯的边缘,也越不过最矮的门槛。要知道这些机器人是以轮子来驱动的,对于包含人工关节的机器义腿的控制比对轮子的控制还要复杂百倍。

对形状的判断与分类是人类的基本技能,这一点在文字的处理上尤为明显。任何一个计算机操作系统中都有字体册,里面存储着百余种字体,每一种都代表着文字或字母不同的显示方式。但无论字体如何变化,一个识字的人都不会把汉字“土”认成“士”,也不会把英文字母“i”认成“j”——这背后隐藏的正是惊人的抽象能力,只不过因为人类已经掌握而显得稀松平常。与此形成鲜明对比的是,即使计算机的形状辨认能力在今天已经得到长足进步,却依然难望人类的项背。

相比于对身体的控制,更难以解释、也更让人着迷的是思维的自主性。人类心目中的常识实际上是个极端复杂的推论系统,更是个意义深远的科学问题。人或动物某一时刻只能处在一个位置、人的身体与思维是一个整体、人死则不能复生……认识这些看似理所应当的事实对人类而言荒谬可笑,可最强大的计算机也未必知道这些常识:他们没有日常生活中的体验、没有来自其他人的教导、也没有关于事实基本构成的核心概念。

人类的大脑就像是一台杂乱地拼装在一起的器件,虽然低效、笨拙,兼之深奥难解,却还能正常工作。无论从哪个层面看,大脑都是个设计拙劣、效率低下的团块,可又出人意料地运作良好。大脑不是一台快速且万能的超级计算机,它不是一个天才在白纸上即兴完成的杰作。大脑是一座独一无二的大厦,沉淀着数百万年的进化历史。大脑很久以前对某个问题形成了特定的解决方法,经年累月一直使用它,或者加以改进用于其他用途,或者严格限制其改变。用分子学家弗朗索瓦·雅各布(Francois Jacob)的话说来就是:进化是个修补匠,而不是工程师。可正是修补匠的缝缝补补,补出了宇宙中最令人叹为观止的智能奇迹。

人类智能与人工智能之间可以通过信息处理的桥梁联系起来,两者都是通过对信息的处理来组织事物。人类智能的运行模式可视为一个信息系统:来自外界的输入信息会刺激大脑产生反应,大脑根据逻辑等先验规则对信息进行处理,处理得到的输出再反馈给外界。但相比于基于计算机的人工智能,人类智能还有无数奥秘有待破解,这也给人工智能的发展路径笼罩上层层迷雾。

世界顶级的计算机科学家高德纳(Donald Knuth)曾经如此评价人工智能:“人工智能已经在几乎所有需要思考的领域超过了人类,但是在那些人类和其他动物不需要思考就能完成的事情上,还差得很远。”人类的心智活动运行得如此流畅,以至于我们把它当作理所当然,却对它的精巧与美妙浑然不觉。直到运用科学与技术尝试解释其运作原理时,其复杂精密的设计才让我们后知后觉地赞叹不已。正是人工智能的发展在一次次地提醒我们:人类能进化到今天的样子是多么伟大的成就。