登陆注册
3529200000004

第4章 神经网络(1)

1986年1月,我开始在加州大学伯克利分校学习。我所做的第一件事,就是整理有关智能和大脑功能理论研究的历史。我阅读了上百篇由解剖学家、生理学家、哲学家、语言学家、计算机科学家和心理学家所著的论文。来自于不同领域的研究者们发表了大量关于思维和智慧的见解,各个领域都有专门的刊物和术语。然而,我发现这些见解既不一致,也不完整。当谈到智能时,语言学家总是会使用“句法”和“语义”等术语,在他们眼中,大脑和智能只同语言有关;视觉科学家习惯于谈论2D、2.5D和3D图像,大脑和智能对他们来说,只与视觉模式识别有关;计算机科学家们则津津乐道于由他们所提出的“模式”和“框架”等表征知识的新术语。没有人提及大脑的构造,也没有人关心这些理论在大脑中究竟如何实现。另一方面,解剖学家和神经生理学家撰写了大量有关大脑构造和神经元作用机理的论文,但对于建构大规模理论却退避三舍。毕竟,想要从各种研究方法以及随之而来的堆积如山的实验数据中寻找方向,实在是一件让人头痛的事。

就在此时,一种新的智能机器研究途径开始崭露头角,为人们带来了希望。虽然早在20世纪60年代后期,神经网络就已经开始以这样或那样的面目出现,但在当时,它同人工智能研究在投资份额和关注度方面存在着激烈的竞争。人工智能就像一只体重800磅的大猩猩,将神经网络研究压制得无法抬头。神经网络的研究者在许多年间一直被列于投资方的黑名单上,只有少数人还在继续关注他们。直到20世纪80年代中期,这一领域才终于得以重见天日。我们很难确切地知道,神经网络为何突然变成了热点,但人工智能的节节失败无疑是其中的因素之一。人们在寻找人工智能的替代品,而最终在神经网络领域看到了希望。

相对于人工智能的方法,神经网络算得上一个真正的进步,因为它的架构建立在真正的神经系统之上,尽管根基尚浅。与计算机程序员不同,神经网络的研究人员(也被称为联结主义者)的兴趣在于了解,如果将一群神经元聚在一起,它们会表现出何种行为。大脑由神经元组成,因此构成了一个神经网络,这是铁一样的事实。联结主义者们希望通过研究神经元之间的相互作用,弄清智能那难以捉摸的特性;他们还希望通过复制神经元群之间的连接,解决那些令人工智能一筹莫展的问题。神经网络与计算机的不同之处在于,它没有CPU,也不需要中央存储。整个网络中的知识和记忆都分散在它的连接上——就像真正的大脑一样。

从表面上看,神经网络似乎非常符合我的兴趣。但很快我对这一领域的希望就又幻灭了。那时,我已经形成了一个自己的看法:对于大脑的理解,有3个标准是必不可少的。第一个标准是,对于大脑功能的理解,必须考虑时间因素。真正的大脑始终在处理快速变化的信息流。在进出大脑的信息流中,没有什么是静止不动的。

第二个标准是,反馈的重要性。神经解剖学家一早就发现,大脑中充满了反馈连接。比如说,在新大脑皮层和丘脑之间连接的神经回路中,反馈连接(信息传递朝着输入的方向)的数目要比前馈连接多出将近10倍!也就是说,对于每一束向大脑皮层传递信息的神经纤维,都对应着10束向感觉器官传递信息的神经纤维。大脑皮层中的神经连接也绝大多数具有反馈功能。虽然反馈的确切作用尚无人知晓,但从已发表的研究报告中可以看出,它无处不在。据此我认为,反馈一定非常重要。

第三个标准是,任何理论或有关大脑的模型,都应该能够解释大脑的物理结构。新皮层并不是一个简单的构造,大家在后面的章节中将会看到,它有着不断重复的层级结构。任何不同于这一构造的神经网络,必定无法像大脑一样工作。

然而,神经网络刚一亮相,就定位于一些极为简单的模型上。这些模型对于上述三个标准无一满足。绝大多数神经网络都是由相互连接的三排神经元组成的。第一排神经元接受某种模式(输入),接着这些输入神经元同下一排神经元相连,我们称这些为“隐藏单元”。“隐藏单元”再与最后一排神经元(输出单元)相连。神经元之间的连接强度有强有弱,按照连接强弱的不同,一个神经元的活动可能会促进另一个神经元的活动,也可能会减弱第三个神经元的活动。神经网络就是通过改变这种连接强度,来学习如何将输入模式映射到输出模式上。

这些简单的神经网络只能用来处理静态模式,不涉及反馈,同大脑也没有任何相似之处。有一种最常见的神经网络,被称为“反向传播(back propagation)”网络,它能将一个错误从输出单元向输入单元传播来进行学习。你可能会认为这是反馈的一个形式,而事实上它不是。这种对错误的反向传送只发生在学习阶段。当神经网络经过训练,工作状态正常时,信息便只会向一个方向传送。在输出到输入的方向上,并无反馈发生。除此之外,这些模型中没有时间:一个静态输入模式被转化为一个静态的输出模式,紧接着又出现另一个输入模式。在这些网络中,哪怕对于刚刚发生的事情也不留存任何历史记录。最后,与大脑的复杂性及其层级结构相比,神经网络的构造显得太小儿科了。

我本以为神经网络领域会飞快地往更加仿真的网络发展,但它并没有。由于简单的神经网络已经能够做出一些有趣的事情,因此许多年后,研究还一直停留在这个层面。这种新鲜有趣的工具,一夜之间让成千上万的科学家、工程师和学生获得了资助、博士学位,发表了著作。利用神经网络进行股票市场预测、处理贷款申请、核对签名以及执行上百种其他模式分类应用的公司,也如雨后春笋般纷纷成立。尽管神经网络创建者的意图可能在于更为广泛的应用,然而当时在该领域居于主导地位的人们,对理解大脑如何工作以及什么是智能等问题,丝毫没有兴趣。

大众媒体对神经网络与智能之间的差别也不甚明白。报纸、杂志和电视科学节目将神经网络介绍为“像大脑一样”或是“以大脑工作原理为蓝本”。与处处需要编程的人工智能不同,神经网络通过事例进行学习,这让它多少看起来更智能一些。NetTalk即为其中的一个突出代表,它能够学着将字母顺序同读音一一匹配。由于这个神经网络是用印刷文本来训练的,因此它乍听起来就是用计算机的声音在朗读单词。不难想象,用不了多久,神经网络就可以同人类对话了。在全国新闻中,NetTalk被错误地介绍为一种能够学习阅读的机器。它虽然是神经网络的一个精彩展示,但所做的事情仍微不足道。它不会阅读,不能理解,且没有什么实用价值。它所做的只是将字母组合同预定的声音模式相匹配。

请允许我用一个类比来说明神经网络与真正的大脑之间差得有多远。想象一下,我们要研究的不是大脑的原理,而是一台数字计算机。经过多年研究后,我们发现计算机中的一切都是由晶体管构成的,亿万的晶体管以精确而又复杂的方式连接在一起。然而我们仍然不明白计算机是如何工作的,也不明白这些晶体管为什么要以这种方式相连。于是某一天,我们决定将几个晶体管连接起来看个究竟。结果我们发现,瞧,将区区三个晶体管以某种方式连接在一起,就构成了一个放大器,一端输入的信号在另一端就会被放大。(收音机和电视机里的放大器就是用晶体管以这种方式制成的。)这是一个重大的发现,一夜之间,使用晶体管放大器制造收音机、电视机和其他电子设备的新工业产生了。这固然是好事,但它还是没能告诉我们计算机是如何工作的。尽管放大器和计算机都是由晶体管构成的,但它们之间几乎再没有别的共同之处。同理,尽管真正的大脑同三排的神经网络都由神经元构成,它们也几乎完全不同。

我在1987年夏天遇到的一件事,又在我对神经网络本来就不太大的兴趣上泼了盆凉水。当时我参加了一个有关神经网络的会议,其间观看了一家名为Nestor的公司的展示。Nestor推出了一种在平板电脑上识别手写文字的神经网络应用,要价100万美元。这引起了我的注意。虽然Nestor大力鼓吹它的神经网络算法多么复杂精妙,甚至将其吹捧为另一个重大性突破,但我却觉得手写识别问题其实可以通过更为简单、传统的方法解决。那天我回到家里,反复思考这个问题。两天后,我设计出了一款速度更快、体积更小、使用更灵活的手写识别器。我的解决方案里并没有使用到神经网络,其工作原理也同大脑完全不同。尽管那次会议引发了我对设计带有触控笔界面的电脑的兴趣(并最终成就了10年后的PalmPilot掌上电脑),但它同样也使我更加确信,神经网络相对传统方法而言,并无太大的改善。我设计的手写识别器最后成为了Graffiti文本输入系统的基础,被广泛应用于第一代Palm产品上。我想Nestor在这场商业竞争中应该是被淘汰了。

简单的神经网络走到了尽头。尽管它们的大多数功能都能被其他方法轻易取代,最终媒体的关注热情也逐渐消散。但至少,神经网络的研究者们并没有宣称他们的模型是智能的,毕竟它们只是些极其简单的网络,功能上也没有超越人工智能。我在此并不想给大家留下一种印象,认为所有的神经网络都只有简单的三层变化。一些研究人员仍在继续研究设计不同的神经网络。如今,这个名词被用来描述一系列不同模型的集合,其中一些从生物学看来是精确的,另一些则不是,但它们几乎都没有抓住新皮层的总体功能和结构。

在我看来,大多数神经网络的最根本缺陷在于——这也是它与人工智能共有的特点——太注重行为。这是一个致命的负担。无论他们将这些行为称为“答案”、“模式”,还是“输出”,人工智能和神经网络研究者都假定智能存在于一个程序或神经网络处理输入信息之后而产生的行为中。计算机程序或神经网络最重要的属性就在于它是否能给出正确的、令人满意的输出,就像阿兰·图灵所给出的启示,智能等同于行为。

然而,智能并不单是指表现出智能的动作或行为。行为是智能的一种表现,但它既不是智能的核心特征,也不是智能的基本定义。片刻的思考就可以证明这一点:即使躺在黑暗中什么都不做,只是思考和理解,你也是智能的。忽略头脑中的活动而只关注于行为,对理解智能和建造智能机器造成了极大的障碍。

在进一步探索智能的新定义之前,我想先介绍另一种与真正大脑的工作原理更为接近的联结主义方法。问题是,似乎没有人认识到这项研究的重要性。

就在神经网络大出风头之时,一小部分研究神经网络理论的学者从主流领域中分离出来,构建了一种不以行为为中心的网络,称之为“自—联想”记忆网络。它同样由相互连接的简单神经元构成,这些神经元在达到一定刺激阈值时会激活。然而它们之间的连接方式与一般的神经网络不同,其中使用了大量的反馈。与只能正向传输信息的神经网络不同,自—联想记忆与反向传播网络类似,能将每个神经元的输出传回给输入——就像自己给自己拨电话。这种反馈回路造成了一些有趣的特点。当一种活动的模式被加予人造神经元时,它们会对这种模式形成记忆,这种网络将外界活动模式同它自身关联在一起,因此被称为“自—联想”记忆。

初看起来,这种回路所导致的结果似乎很荒谬。想要检索一个被存储于这种记忆中的模式,你必须先提供这个模式。这就好比你去杂货店买香蕉,当店主问你如何付款时,你说用香蕉。你可能会问:“这样的设计有什么好处呢?”然而,自—联想记忆所拥有的一些重要特征,在大脑中亦有体现。

其中最重要的一个特征是,如果想要检索某个模式,你不必事先拥有这个模式的全部,只要有其中的一部分甚至一个乱作一团的样子就可以。即使从一个混乱的版本开始,自—联想记忆也可以检索到最初存储时的正确模式。这就好比拿着吃剩的半把褐色香蕉去杂货店换回了一整把绿色香蕉一样。或是你拿着残破得无法辨认的钞票来到银行,柜台职员对你说:“我看得出这是一张破损的百元大钞,来把它给我,我给你换一张崭新的。”

第二个特征是,与大多数其他的神经网络不同,自—联想记忆可被设计用来存储模式序列,或称为时序模式。这一功能可以通过在反馈中加入延时来实现。有了这个延时,你便可以向该网络呈现一个模式序列,类似于一段旋律,自—联想记忆就可以记住它。当我输入“一闪一闪亮晶晶”的前几个音符时,自—联想记忆马上就可以返回给我整首曲子。当输入序列的一部分时,该记忆便能够回忆起其余的部分。我们将会看到,这同人们学习几乎所有模式序列时的方式如出一辙。我认为,大脑就是使用与自—联想记忆相似的回路来实现这种学习的。

自—联想记忆提示了反馈和随时间变化的输入的潜在重要性。遗憾的是,绝大多数的人工智能、神经网络和认知科学家都忽视了这两者。

同类推荐
  • 后谷歌时代:大数据的没落与区块链经济的崛起

    后谷歌时代:大数据的没落与区块链经济的崛起

    《后谷歌时代》一书的作者乔治·吉尔德是一位颇具远见卓识的智者。他在技术和文化领域具有无与伦比的视野和见地。他向读者描述了谷歌所面临信任与安全危机,并勇敢地预测了即将到来的后谷歌时代。谷歌的“搜索和排序”能力吸引了世界。看似免费小应用,诸如视频、地图、电子邮箱等让用户欲罢不能。但一个没有价格竞争的体系必将扼杀创业精神,并最终将互联网变成广告的荒原。缺乏信任与安全是谷歌致命的弱点,且当前的计算机和网络体系无法解决这一危机。如果价值和安全不是信息技术体系结构的组成部分,那么这个体系结构必将被替换。作者认为长期由少数巨头把持的互联网将面临着一场“大拆解”。
  • 伊斯兰经济思想

    伊斯兰经济思想

    本书作为中国第一部较为系统地探讨伊斯兰经济思想的学术著作,共5章16节,论述了伊斯兰经典经济思想、中世纪伊斯兰经济思想、近代伊斯兰经济思想、现代伊斯兰经济思想、中国伊斯兰经济思想的发展历程、基本内容、基本特点、主要代表人物等。
  • 现代服务业:特征、趋势和策略

    现代服务业:特征、趋势和策略

    本书作为“现代服务业发展战略研究”课题的研究成果。深入分析了现代服务业的概念、内涵、分类体系和理论基础,归纳总结了当前全球现代服务业发展总趋势,全面客观评价了我国现代服务业发展的重要意义、 发展现状和主要问题,提出了新时期我国现代服务业发展的目标、方针、 战略、重点、科技支撑体系和区域布局,以及相应的政策措施。 本书可供经济规划工作者、研究者、高校相关专业师生参考阅读。
  • 经济热点面对面

    经济热点面对面

    中国的经济到底是怎么了?经受了这些打击和考验,中国的经济会大幅下滑吗;通货膨胀率还会上升吗;中国的石油安全吗;中国的粮食安全吗;中国的中小企业能起死回生吗;中央政府会怎么办;宏观政策会走向哪里?这些原是经济学家们关心的话题,在这一年都成了老百姓迫切想要弄明白的问题。
  • 舒立观察:中国十年之真问题

    舒立观察:中国十年之真问题

    中国的法律体系如何逐步健全;金融改革如何能走得更远;重大民生问题如何妥善解决;行政性调控如何淡出,市场化调控如何跟进;在全球化时代,中国想要什么样的世界,世界想要什么样的中国……复活风云激荡的过往事件,重现载沉载浮的财经人物,总结中国十余年来在政治经济诸多领域所取得的重大进步,激发人们继续前行的勇气……新闻本身是易碎的,但新闻记者对于永恒性的追求是始终不渝的。
热门推荐
  • 庄严王陀罗尼咒经

    庄严王陀罗尼咒经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 迷人娇妻

    迷人娇妻

    被算计,白夕惹上冥城第一豪门风家大少风澈夜,人生发生改变,成为了风太太!而五年后,白夕却决定向风澈夜提离婚,谁知......--情节虚构,请勿模仿
  • 口技

    口技

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 赎情总裁

    赎情总裁

    【简介】当了他三年的情妇,最终难逃被抛弃的命运。原本要坚定守护的心,也遗失在了这个无情的男人身上。幸好,她还有一点点的自尊和骄傲。带着一颗破碎的心,她离开了这个伤心的城市!*五年后,一个名动世界的设计师衣锦还乡。再次踏上这片熟悉而神伤的土地,她是否还能保持着波澜不惊的心?*夏雨薇,一个当了他三年情妇的女人。她微笑的样子,哭泣的样子.该死的!直到她离开后,他忽然觉得心里空了一片,且是再也补不回来的!为了填补她离去后的空白,他转身从一个冷漠无情的人变成了花花公子,夜夜留恋在花丛中,可心里那份失落越来越大!等到再次见到她时,她却已是世界知名的设计师,身边有了位白马王子,还带着一个三岁大的小女孩。该死的!他只能眼睁睁的看着幸福的一家三口。直到.他无意之中听到的一个秘密~这次,无论如何,他都不会再放手!一个俗气的故事,只想阐述一段动人的感情!&&&&&&&&&&&&&&&&&&&&&&&&&&&&&【推荐好友儛亦柔筝的文:】×××××××××××亲们,迷蓝亲亲为《赎情》建了个群,有兴趣的可以加入讨论!谢谢迷蓝亲亲~~群号码:29155097(已满)新群:20200177--------------------------------------*分割线*--------------------------------------------《爱上古板老婆》她是平凡的都市白领,性格古板他是站在世界顶端的富豪子弟...他们却奇异的有了交集。婚后再相爱的古老模式再次重演。平凡的她要如何在豪门世家立足面对苛刻的婆婆,她古板的性格又该如何应对?面对彬彬有礼的丈夫,她又该何去何从?长到二十八岁,在嫁给他之后,爱上他之后,她才懂得,什么是最温柔的残忍!
  • 小农女要种田

    小农女要种田

    她家的后山上,突然有一天来了一个失忆的杀手。她毫不客气把他捡回家。哼哼,告诉你,你的苦日子开始了……咱家正缺一头牛,咱爷正在寻一个苦力,还有咱家往后发家致富的重担,可全要靠你……
  • 现代人智慧全书:智慧诡辩术

    现代人智慧全书:智慧诡辩术

    诡辩术是智慧的另一个消极变种,是智慧后边拖着的那一条黑影。《智慧诡辩术》介绍244种适合不同对象的超级口才,包括:训练你的诡辩智慧、诡辩术中的幽默等内容。指导您做适者生存、永立人上的强者。
  • 许你诺言,赠我欢颜

    许你诺言,赠我欢颜

    你有没有默默地爱过一个人,在年少懵懂的岁月里?那时她尚且不懂什么是爱情,却将他小心翼翼珍藏在心底,一搁就是整整十年。十年前,她是集万千宠爱于一身的江家公主,身旁追随者无数;十年后,她却成为众人攻击谩骂的众矢之的,人人避之唯恐不及。再次重逢,他是意气风发的特警队长,她却是默默无闻的图书管理员。他一反从前的冷静自持,主动出击,想将心中的小美人一举拿下;她却早已不是旧时模样,谨慎防守,不愿跟他生出更多纠缠。面对家中堂兄的步步紧逼,几家势力的暗中博弈,他与她原本单纯的恋情,却成为众人眼中不可宽恕的罪过。当时光流转,思念绵延,他们始终躲不过宿命,升级版高帅富特警拯救豪门落魄千金。
  • 柳氏叙训

    柳氏叙训

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。
  • 醒在末世前

    醒在末世前

    当从梦境醒来,睁开双眼,秦汉已经踏上了一条救世主之路。
  • 明伦汇编人事典十五岁部

    明伦汇编人事典十五岁部

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。