从人工智能的由来和发展来看,实现人工智能的具体方法是不同的。吴军在《智能时代:大数据与人工智能革命重新定义未来》一书中,将人工智能的定义分为狭义和广义两种。狭义的人工智能专指20世纪50、60年代特定的研究机器智能的方法(也即人工智能1.0版),坚持机器人要像人一样思考才能获得智能,并形象地称之为“鸟飞派”[10]。广义的人工智能[11],则还包括通过数据驱动、知识发现或者机器学习等现代方法实现的机器智能(不妨将其称为现代机器智能)。通俗地说,“鸟飞派”这一传统机器智能类似于仿生学,而现代机器智能则类似于工程学。以自动翻译为例,“鸟飞派”的智能要求机器能够理解和模拟人类语言的语法并寻找到对应的映射关系,但这种方法无法让计算机真正有类似于人的智能,并最终遇到了无法克服的困难,因为对于有些语义的理解来自于人们的常识或者说关于世界的知识(World knowledge),而非来自语法分析和语意本身。[12]相反,依赖于数据驱动的现代机器智能另辟蹊径,它基于“统计+数据”的方法,训练出了有效并能不断改进的数学模型,并根据数学概率论等精准地找到翻译语言的对应关系。在这种方法下,句子并不被理解为是否符合语法规则,而是各个词组组合的概率大小如何,也即一个句子是否合理,要看它的可能性大小如何。[13]也正是在这个意义上说,机器智能最重要的是能够解决人脑所解决的问题,而不在于是否需要采用和人一样的方法。[14]人们相信,只要有充分且质量可靠的数据,这种机器智能的方法在理论上就是有效的。
事实上,人工智能之所以复兴,关键也在于大数据的突破性进展。“近年来人工智能之所以能取得突飞猛进的进展,正是因为这些年来大数据的持续发展。而各类感应器和数据采集技术的发展,人类开始获取以往难以想象的海量数据,同时,也开始在相关领域拥有更深入、详尽的数据。而这些数据,都是训练相关领域智能的基础。”[15]一方面,平台经济的发展融合了线上线下空间,推动了各种设备的互联互通,使人们在“嵌入”以互联网物联网为技术基础的社会网络体系的同时,时时刻刻产生和留存着大量的可供分析和产品化的数据,个人在某种意义上也成了“量化自我”[16]。另一方面,支撑这些海量数据存储和运算的算力条件也不是问题,正如摩尔定律所表明的:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18个月至24个月便会增加一倍,性能也将提升一倍。也就是说,信息技术的加速度发展使得数据处理成本日益低廉,人工智能的发展基本上不存在硬件上的瓶颈。在这样的条件下,就有可能在海量的大数据中发掘出多维度的信息,从而在知识应用领域发生从量变到质变的飞跃。
本轮人工智能得以迅速发展的另一个技术原因是,与大数据密切相关的算法的发展。机器学习,就是从已知的知识(特征)出发,利用概率统计等数学计算方法来得到某种数学规律(模型),并利用所得数学规律来计算并完成任务。概括地说,就是利用事物本身具有的数据特征,用数学的表达方式来构建数学模型并完成既定的任务。以人类认知星空为例,这里的“任务”就是要对星星接下来的运动作出预测,“特征”是星星的运动状态以及观测时间,“模型”就是通过时间和运行轨迹来得到星星的运行规律。[17]此处的模型也即算法。之所以说算法与大数据密切相关,一方面是因为算法要经由大数据训练而来,且数据样本越全质量越可靠,相应的算法也就越有效,这也是算法改进的基础所在;另一方面,与以往众多的数据分析技术相比,本轮人工智能技术立足于神经网络,并在此基础上发展出多层神经网络,从而突破了传统的线性建模算法,完全利用输入的数据自行模拟和建构相应的模型结构。这种算法在以往也存在,但因算力不足、数据不够等原因,几乎没有实际应用的价值。如今,高速并行运算、海量数据及更优化的算法打破了这一局面,并共同促成了人工智能发展的突破。[18](www.xing528.com)
综上,可以看出,本轮人工智能的实质是以大数据、算法、算力为基础和动力的机器智能,并非有机智能。其中,大数据是核心,无论是对算法的开放设计,还是对算力的提升强化都围绕着这一“基础资产”而展开。同时,这也意味着,本书摒弃了以仿生学的思路来探讨人工智能及相关司法应用问题[19],诸如机器人人格、机器人法官之类的提法均不在讨论之列,而是从工具论意义上审视人工智能的司法应用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。