20世纪80年代就有学者提出了“计算机考古”的概念,设想将计算机用于数据存储、资料管理、信息检索、考古图形处理、仪器分析的数据处理、类型学断代系统等方面〔34〕。时至今日,这些设想有的已经成为现实,有的还依旧在探索中。通过信息化促进田野考古资料的深度数据挖掘已然成为“计算机考古”的目标。
我国的文物考古工作经过数十年的发展,取得了丰硕的成果,积累了大量的实物资料和档案资料。考古学的任务在某种程度上说就是要从这些海量的资料数据中尽可能多地获取信息,来帮助我们认识过去。进入21世纪以来,信息化技术的使用已经极大地推动了我国考古学研究的进展,这在考古GIS的应用方面表现得最为突出。GIS可以对通过GPS测绘技术或者遥感成图技术获得的考古遗址或遗迹的位置和图形图像数据进行综合分析和集成研究,也可以使用虚拟现实技术对不同的考古现象进行虚拟〔35〕。例如,在对新近发现的浙江余杭良渚古城外围大型水利工程的论证过程中,考古学家使用GIS技术模拟分析了良渚先民在古城以北修筑的高、低两级水坝的抗洪、蓄水能力,证明了这一史前水利工程的真实性和有效性〔36〕。
除此之外,对考古信息的“数据挖掘”(Data Mining)研究也逐步展开,成为一个重要的发展方向。数据挖掘是计算机科学中一种将传统的数据分析方法与处理大量数据的复杂算法结合起来的技术,其技术来源主要基于数据库、统计分析、机器学习和神经网络,在很多领域都有应用。数据挖掘所得到的信息具有“先前未知”的特点,换言之,数据挖掘要发现的是不能靠直觉发现或者依靠传统的研究方法无法发现的信息和知识。目前国内这方面的应用研究主要集中在聚落考古方面,又分为两个层次:一是单一聚落内部的遗迹空间数据和属性数据的挖掘,二是聚落群中聚落分布和面积特征的数据挖掘。例如,毕硕本等人对姜寨聚落的数据挖掘工作得到了一些不同于考古学家的新认识。他们采用聚类算法对姜寨一期聚落的房屋和墓葬的空间数据进行的挖掘,得出了其中大、中房屋组和墓葬区的空间聚类规则,其结果与姜寨遗址发掘报告中的分区结果大致相同,但对于个别房屋、灰坑的分区归属又存在差异〔37〕;他们又采用Apriori关联算法对姜寨一期的主要文化遗迹的属性数据进行了关联挖掘,找到了其中隐含的关系,为聚落遗址的资料分析提供了一种新技术〔38〕。在运用数据挖掘技术研究聚落群的长时段演化方面,他们采用决策树分类算法对郑州—洛阳地区史前四个连续文化时期(裴李岗文化—仰韶文化前期—仰韶文化后期—龙山文化)的聚落进行了数据挖掘,提取了聚落遗址面积的分类规则,并根据这些分类规则和聚落的空间分布情况对四个文化时期的I级聚落进行对比分析,发现I级聚落中的一些特大面积的聚落正逐渐发展成为地区的中心聚落。这为研究郑洛地区城市的起源,乃至日后这一地区王都的形成提供了依据〔39〕。除了聚落考古方面,数据挖掘技术还被应用于对考古地层空间数据的分析。例如,利用虚拟钻孔扫描姜寨遗址地层剖面获得相关信息,从中提取各文化层及遗迹的厚度、顶界和底界深度等空间数据,用于定量分析考古地层相对早晚关系,建立地层数字高程模型〔40〕。再如,使用IDL语言开发空间数据挖掘工具分析成都金沙遗址I区“梅苑”祭祀区西北部的地层空间数据,提取了地层空间特征的统计信息和隐含规律,反演了金沙遗址的地层沉积过程〔41〕。(www.xing528.com)
由此可见,数据挖掘在对田野考古资料的信息提取方面具有深厚的潜力,但也不得不承认我国目前在这方面的工作开展得还很不充分。究其原因,一方面是缺少考古学与计算机科学之间的跨学科人才,专业壁垒、技术门槛导致这种跨学科研究难以广泛开展。另一方面,更重要的原因可能是基础数据的缺乏。从已有的研究来看,主要集中在姜寨、金沙、郑洛这么少数几个遗址或地区,说明只有特定的掌握资料的考古学家与掌握技术的计算机科学家相互协作才能将此类研究付诸实施。这也从另一个侧面反映了目前田野考古资料的数字化与资源共享做得很不充分。只有随着田野考古信息化工作的进一步推进,才能吸引更多的掌握数据挖掘技术的学者参与到考古学研究中来,帮助考古学家充分提取蕴藏在考古资料中的各类隐含信息,将考古学研究推向一个更高的层次。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。