关于如何调查“匿名者”,追寻永生的同类们,想法、思路大概都一样。
那么,作为永生之路上的后来者,能力又不太可能胜过所有的竞争者,找不到线索也很正常。
之所以出现这样的情形,无非是因为,在网络上调查一个ID的身份和行迹,黑客的手段都差不多,人类的思维模式也多少会有相似之处;他方然能想到的办法,先行者差不多都会早一步想到、并采取行动。
但是AI的行动策略,某种程度上,就和人的思维不太一样。
对人工智能的研发认识有限,方然对AI应用于具体事务的原理也不甚了了,不过,既然AIASG能通过机器学习的方式逐渐模仿人的软件开发活动,那么原则上讲,使用类似的系统来模仿自己的搜索活动,应该也是可以的。
至于说,AI能够在这样的任务中发挥到什么程度,AIASG的表现可以作为对照:
根据自己掌握的资料,在经历过一次大规模升级后,就在不久之前,开发团队在AIASG工作流程的一次梳理中,发现其具备了“有限意义”的创造性开发能力:在开发某服务器驻留程序时,面对某具体需求,系统自主完成了一段算法、并将其内嵌到软件中,而且这段算法,在AIASG的数据库中,是找不到的。
对给定的问题,提供算法,人工智能的这一进展是突破性的。
某种程度上,如果按某些研究者的观点,这甚至可以作为AI具有某种“意识”的证据,虽然系统实现的算法,在数据库中有若干相近的算法作为基础,但对这些算法进行组合、协调,用来解决全新的问题,这在以前完全是人类算法设计师才具有的能力,也是人类智慧独一无二的标志。
现在,哪怕只是解决简单的问题,AI自己也能做到。
对人工智能的这一进展,方然看在眼里,觉得有些不可思议,但眼下他没时间去探究这意味深长的突破,而是设法从“国际商用机器”的内部网络里,寻找AIASG开发过程中的项目资料,继而得到该项目的部分早期代码。
一边看代码,一边查开发文档,方然很快发现该项目的复杂度超乎想象,核心的人工智能模块没什么新意,倒是负责分析软件需求的部分,十分庞大而精密,这部分的代码也是最零散而不成系统的,好在对自己的设想而言,这部分用处并不大,于是他将意图组织、掩饰,然后发布到黑客论坛上。
自己开发可用的系统,耗费时间太长,方然索性将其发布为商业项目。
在AI大行其道,哪怕外行都能看出大趋势的今天,网络上人工智能相关的开发项目浩如烟海,混杂在大量类似的开发计划里,“自动搜索分析”的项目描述并不起眼。
在人工智能的应用难度上,搜索、分析数据,是相当基础的操作,最后还是要提交给自己来判断,这样的项目,规模并不太大,方然用新注册的ID扮演承包商,向参与项目的兼职者支付报酬,大概在西历1472年初秋,得到了第一个可用版本。
初步测试软件,利用“自动搜索分析器”抓取信息,方然对AI的能力进行了评估。
将命名为ASA的软件上线到第三方服务器后,每天抽一点时间查看日志,一周后,方然验证了自己的预测。
人工智能自动抓取数据分析的能力,没有想象中那么强,排除服务器计算资源的限制后,总体上还是要比他自己来做慢得多,收集到的讯息杂乱无章,即便经过筛选,也很难汇总成有条理的报告供人阅读。
但这只是系统第一次上线的表现。
在这之后,随着机器学习的进行,盘踞在代码中的神经网络架构逐渐熟悉了操作流程,搜索的准确率和速度都在提升,不仅如此,此前在AIASG运行中观察到的现象,也出现在了ASA的行为模式里。
这也正是方然所需要的。
在网络上搜索、分析资料,做法,无非是截取数据并进行处理,这一点无论是人、还是程序来做,都只有速度和广泛度的区别。
但问题在于,面对互联网络上数以亿计的信息节点,数以万亿计的数据文件,乃至数以ZB(十万亿亿字节)计的数据,如此庞大的数据量,没可能不加选择的进行分析处理,究竟要如何取舍,就十分棘手。
面对这种规模的问题,人和计算机的思路,并不一致。
面对数据量超出分析能力的情形,人的解决办法,往往是借助自身的经验、和已经掌握的线索,进行通过率极低的初步筛查,把百分之九十九点九的信息来源都排除在外,接下来,在实施数据截取、系统侵入时,又会进行类似的筛选,把有限的时间精力集中到最有可能取得突破的方向。
这样做,说好听点是更有针对性,说实话则是面对海量数据的妥协。
譬如方然自己,之前调查“匿名者”的时候,虽然尽可能的多方面收集讯息,但,再怎样拓宽口径,也不会去侵入汉堡王的结账系统,或者窥探汽车零部件供应商的库存数据,因为这些与“匿名者”行踪八竿子打不着的数据,没有任何搜查的必要。
但人工智能却不这么认为:
凭借远超人类的处理能力,AI更倾向于采用“广种薄收”的策略。
每天查看ASA系统的分析报告,经过几个月的训练,方然认为这一系统已具备了实战能力,考虑再三,他又花费时间将核心代码内嵌到伯克利大学自然科学部的服务器里,以“学术数据搜集与分析系统”的名义来运作。
项目部署完毕,在秋天的伯克利,方然每天的日程就多了一项内容,基本上,不论在实验室还是在寝室里,他都会打开监视器,用旁观者的视角去审视ASA的行为,一来是扮演嗅探者的角色,评估这一系统、乃至隐藏于幕后的自己被发现的风险,二来也可以更客观的观察人工智能的数据搜集策略。
上线不久,“自动搜索与分析”系统的表现,就出乎了方然的意料。