近年来,国内外知识发现研究学者对知识发现的研究现状、前沿与热点、发展趋势等进行了一定程度的研究。温有奎等认为,国内KDD研究主要方向包括:①在分类技术的研究上,试图建立其几何理论体系,并实现海量数据处理;②以粗糙集理论为基础,构造模糊系统知识模型与系统辨识方法;③将Bayes网与Petri网用于知识发现;④研究粒度时空数据的数据挖掘;⑤中文文本挖掘的理论模型与实现技术;⑥利用概念格进行文本挖掘。[45]孙吉红和焦玉英认为,知识发现研究的重点领域和趋势集中于文本挖掘、数据挖掘(查询)语言的设计、数据立方的数据挖掘、概念知识库挖掘、基于可视化的知识发现、复杂数据类型挖掘的新方法、可伸缩的数据挖掘方法。除此之外,知识发现与数据隐私保护和信息安全、开发知识发现语言、专项挖掘查询语言及其优化等也是数据挖掘未来发展的趋势。[46]靳展认为,知识发现的研究重点正在逐渐从发现方法转向系统应用,并且日益注重多种发现策略和技术的集成及各种学科之间的相互渗透。[47]李进华认为,网格环境下的分布使知识发现将朝着更广范围与更大规模的数据集、更丰富的知识发现工具、更加智能化的知识发现调度策略、更高程度自动化的知识发现流程、更加个性化的知识服务等方面发展。[48]
文本趋势挖掘是近年来文本挖掘的研究热点,其成果具有广阔的应用前景。涉及文本趋势挖掘的方法和技术的基础研究也逐渐受到重视。文本趋势挖掘的主流方法与技术主要有:关键词分布距离法、频繁项集挖掘法、RFM分析法、语言模型法等。[49]知识发现工具的集成化和知识发现语言的标准化也是当今知识发现的发展方向。目前,国内外出现了一些比较有影响的数据挖掘系统,包括各种专用或通用的数据挖掘软件。其中,比较有影响的典型数据挖掘系统有:SAS公司的Enterprise Miner、IBM公司的Intelligent Miner、SGI公司的SetMiner、SPSS公司的Clementine、Sybase公司的Wareho use Studio、加拿大Simon Franser大学开发的DBMinner等。此外,Oracle、Informix等大型数据库公司目前也正在把他们的数据库向战略研究分析工具方向转移,Oralce公司通过向数据库增加统计算法的方式将数据挖掘功能加入数据库,Informix公司则在数据库产品中提供数据挖掘支持。加拿大Simon Franser大学的韩家炜教授等人在其开发的数据挖掘系统DBMiner中设计了一种数据挖掘查询语言DMQL(Data Mining Query Language)。研究专门用于知识发现的数据挖掘语言,使得发现语言具有形式化描述并且如同数据库查询SQL语言一样走向形式化和标准化。标准化是今后数据挖掘语言发展的趋势。[50](www.xing528.com)
可视化在知识管理领域获得了越来越多的应用,数据挖掘与知识发现领域也引进了可视化的研究。可视化数据挖掘利用可视化作为人机交流渠道,将人的随机应变能力、感知能力与计算机巨大的存储能力结合起来,消除自动算法给用户带来的理解上的困难。基于可视化数据挖掘的知识发现模型,其过程主要有四个步骤:数据的收集和存储、将数据处理转化成可以理解的形式、产生一个可视化的数据表示、用户从中感知和挖掘知识。[51]可视化研究也有实例出现,有学者对中国25年来有关杂交水稻研究的文献的引文数据进行整理,利用引文时序可视化软件构建引文编年图,鉴别出代表杂交水稻研究学科发展关键事件的文献,梳理杂交水稻研究在这段时间内的发展规律,将研究结果与从事杂交水稻研究的专家观点进行对比,发现两者具有高度的重合性,证明了该项研究的价值。[52]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。