数据挖掘(data mining,DM)与知识发现(knowledge discovery in database,KDD)是具有共性的内容。“知识发现”一词最早出现于1989年8月在美国底特律的第11届国际人工智能联合会议的专题讨论会上。随后几年,美国举办了有关知识发现的专题讨论会。1995年,第一届知识发现和数据挖掘的国际学术会议在加拿大召开,此后,知识发现与数据挖掘开始流行起来。[41]
不过,由于意义和方法相近,知识发现和数据挖掘两者的概念一直不太清晰。直到KDD 1996年国际年会上,知识发现研究领域的知名学者Fayyad,Piatetsky‐Shapiro和Smyth对KDD给出了一个较为明确的定义。他们认为:“KDD是从大量的数据中提取出可信的、新颖的、有效的,并能被人理解的模式的非平凡的处理过程。”而数据挖掘则是“从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程”[42]。(www.xing528.com)
有学者认为,知识发现(KDD)是从数据中发现有用知识的整个过程,数据挖掘(DM)则是KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式。[43]但就上述两者的定义本身来说,这种理解似乎是有问题的。上述定义中,知识发现与数据挖掘的区别在于两者工作环境的不同,知识发现针对的是“可靠的”数据,而数据挖掘针对的是“不可靠”的数据,这应该是两者最大的区别。随后,邱均平又加入了知识挖掘的概念,认为作为知识发现(KDD)的核心技术,人们通过数据挖掘和知识挖掘,充分提高数据、信息和知识的有效性及利用价值,预测未来趋势及行为以求做出前瞻的、基于知识的决策。也就是说,知识发现有两个具体的方式——数据挖掘与知识挖掘,并且数据挖掘所收集的信息和知识可以作为知识挖掘对象——知识库中知识的积淀和储备,为知识创新拣砖铺路。[44]这么说来,数据挖掘的最终目标就是将有噪声、不可靠的数据“净化”,为知识挖掘做好准备。根据这个观点,我们可以认为数据挖掘和知识挖掘的应用领域并不相同。目前,数据挖掘在多个领域都有广泛的应用,如企业的市场营销、风险管理等,军事领域的情报搜集、战场事态评估,图书情报领域的读者管理、信息咨询,网络中的搜索引擎等。而知识挖掘的应用范围则主要集中在企业针对个人或者团体的隐性知识的挖掘、知识网络的构建、知识地图的绘制等,以期能够达到知识的共享和创新的目标。综上所述,邱均平提出的知识挖掘概念更接近于知识管理的概念,不过其对数据挖掘的理解与Fayyad提出的定义一致。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。