最早提出的知识挖掘的相关概念是知识发现(KDD),是在1989年8月的于美国底特律举办的第11届国际人工智能联合会议的专题讨论会上。随后几年,美国举行了有关知识发现专题讨论会。1995年,加拿大召开了第一届知识发现和数据挖掘(data mining,DM)国际学术会议。自此,知识发现与数据挖掘开始流行起来。但一直以来,人们对数据挖掘和知识发现并没有进行严格的区分,因此产生了很多不同的术语,如知识挖掘(knowledge mining)、信息挖掘(information mining)、知识抽取(knowledge extraction)、数据模式处理(data pattern processing)、数据考古(data archaeology)、信息收获(information harvesting)、筛选(sift ware)及数据疏浚(data dredging),等等。
近年来,与知识管理、知识组相关的研究在图书馆界风头正盛,因而知识挖掘成为相关术语中使用频率最高的词汇,数据挖掘与知识发现次之。这三个术语也是国内使用最为广泛的概念。对于这三个概念之间的关系,国内各学者有着不同的意见。
对于知识发现与数据挖掘两者的关系,目前主要有三种观点:一是数据挖掘就是知识发现,二是数据挖掘仅仅是知识发现的一个步骤,三是数据挖掘与知识发现是完全不同的两个概念。[73]多名学者对此进行了详细的辨析。有学者认为,知识发现的概念内涵包括隐性关联知识发现、非相关文献知识发现和数据库知识发现,并以图表的形式,从发现领域、发现对象、未被发现原因、发现目的、发现方法等方面进行比较,说明数据挖掘不仅是知识发现的一个方面,而且是知识发现的核心[74]。也有学者以数据挖掘与数据库中的“知识发现”(知识发现的英文就是knowledge discovery in database,即在数据库中进行知识发现)比较,强调挖掘目的的有用性、挖掘源头的广泛性、挖掘手段的综合性以及挖掘内容的知识性、挖掘价值的潜在性、应用方式的具体性等。[75]
还有一种观点认为知识发现又称作知识挖掘。[76]邱均平对此并不赞同,他认为作为知识发现的核心技术,数据挖掘和知识挖掘使人们得以充分提高数据、信息和知识的有效性及利用价值,进而预测未来趋势及行为并做出前瞻的、基于知识的决策。也就是说,邱均平提出了知识发现的两个具体方式——数据挖掘与知识挖掘。[77]
总的来看,数据挖掘、知识挖掘、知识发现都有从海量数据中获取相关所需内容的含义,其中数据挖掘和知识发现是早期产生的两个针对不同对象进行工作的概念。数据挖掘在国内使用最早,已有十几年的使用时间,知识发现则是近些年所用较多的概念,而知识挖掘是后起的,是在知识管理被广泛讨论之后产生的国内研究者常用的概念。
【注释】
[1]王知津.知识组织理论与方法[M].北京:知识产权出版社,2009.
[2]刘钢.从信息的哲学问题到信息哲学[J].自然辩证法研究,2003(1):45 -49,74.
[3]叶鹰,金更达.基于元数据的信息组织与基于本体论的知识组织[J].大学图书馆学报,2004(4):43-47.
[4]刘柏嵩.ODL:一种基于本体的新型数字图书馆[J].大学图书馆学报,2005(3):11- 15.
[5]叶鹰.信息科技的形式本体论研究[J].情报学报,2003(5):561-564.
[6]王红伟,韩红宇.Web本体语言OWL及推理研究[J].煤炭技术,2010(7):217-218.
[7]李景.主要本体构建工具比较研究(上)[J].情报理论与实践,2006(1):81,109-111.
[8]范轶,牟冬梅.本体构建工具Protégé与KAON的比较研究[J].现代图书情报技术,2007(8):18-21.
[9]王长霞,李冠宇,陈布伟.语义网本体构建工具现状及发展趋势研究[J].计算机与现代化,2009(7):26-31.
[10]李景.主要本体构建工具比较研究(下)[J].情报理论与实践,2006(2):222-226.
[11]彭敏惠,司莉.Protégé本体构建工具应用调查分析[J].图书情报工作,2008(1):28-30.
[12]牟冬梅,范轶.数字图书馆领域本体的构建与推理——以医学领域本体为例[J].图书情报工作,2007(8):26 30.
[13]姜颖,黄国彬.国外近两年有关本体研究的进展综述[J].图书馆学研究(应用版),2011(7):10 15.
[14]余倩.近年来领域本体的应用新进展[J].图书馆建设,2008(8):95 99.
[15]余倩.近年来领域本体的应用新进展[J].图书馆建设,2008(8):95-99.
[16]姜颖,黄国彬.国外近两年有关本体研究的进展综述[J].图书馆学研究(应用版),2011(7):10 15.
[17]邓志鸿,等.Ontology研究综述[J].北京大学学报(自然科学版),2002(5):730 738.
[18]Chen P,Ra V.A query‐based medical information summarization system using ontology knowledge[C].Proceedings of the 19th IEEE Symposium on Computer‐Based Medical Systems,2006:37-42.
[19]徐静,孙坦,黄飞燕.近两年国外本体应用研究进展[J].图书馆建设,2008(8):84-90.
[20]贾君枝,牛雅楠.本体评估工具的比较分析[J].图书情报工作,2010(6):87 90.
[21]于晓繁,王效岳,白如江.本体集成方法和工具综述[J].现代图书情报技术,2011,(1):14-21.
[22]http://people.aifb.kit.edu/phi/pub/kweb‐221.pdf.
[23]于娟,党延忠.本体集成研究综述[J].计算机科学,2008(7):9-18.
[24]于晓繁,王效岳,白如江.本体集成方法和工具综述[J].现代图书情报技术,2011(1):14-21.
[25]王效岳,胡泽文,白如江,等.本体集成:概念、过程、工具与方法综述[J].图书情报工作,2011(16):119-25.
[26]魏哲雄,冯志勇.基于字典技术的本体整合系统[J].计算机应用,2007(2):428-430.
[27]Timon C,Feng L,Irwin K.Managing knowledge on the Web‐extracting ontology from HTML Web[J].Decision Support Systems,2009(47):319-331.
[28]王知津.知识组织理论与方法[M].北京:知识产权出版社,2009:298.
[29]孙鑫.主题地图及其在知识组织中的应用[J].产业与科技论坛,2011(8):78-80.
[30]刘丹.国内主题地图研究综述[J].图书情报工作,2012(5):62 66,127.
[31]吴江宁,田海燕.基于主题地图的文献组织方法研究[J].情报学报,2007(3):323-331.
[32]秦铁辉,郭延吉,孙琳.信息时代的“全球定位系统”——主题地图[J].江西图书馆学刊,2005(1):1-3.
[33]王知津.知识组织理论与方法[M].北京:知识产权出版社,2009:302.
[34]田海燕.基于主题地图的文献组织方法研究[D].大连理工大学,2006.
[35]韩泽春.主题地图——一种有效的知识组织与揭示方法[J].忻州师范学院学报,2005(4):122-124.
[36]张露,成颖.主题地图研究综述[J].情报科学,2009(2):305-309.(www.xing528.com)
[37]张佩云,吴江,贾晖.主题地图标准及其应用研究[J].安徽大学学报(自然科学版),2004(3):19-22.
[38]王君,樊治平.一种基于主题图的组织知识的分布式存取架构[J].情报学报,2004(1):10 -14.
[39]王知津.知识组织理论与方法[M].北京:知识产权出版社,2009:316 317.
[40]朱良兵,纪希禹.基于Topic Maps的叙词表再工程[J].现代图书情报技术,2006(9),81-84.
[41]黄晓斌,邓爱贞.现代信息管理的深化——数据挖掘和知识发现的发展趋势[J].现代图书情报技术,2003(4):1-3,16.
[42]邱均平,周倩雯.数据挖掘与知识挖掘的比较研究[J].情报科学,2010(12):1862 1865.
[43]邱晓辉.知识发现与数据挖掘分析[J].情报探索,2011(1):99 101.
[44]邱均平,周倩雯.数据挖掘与知识挖掘的比较研究[J].情报科学,2010(12):1862 1865.
[45]温有奎,徐国华,赖伯年,等.知识元挖掘[M].西安:西安电子科技大学出版社,2005:53.
[46]孙吉红,焦玉英.知识发现及其发展趋势研究[J].情报理论与实践,2006(5):528 531.
[47]靳展.基于语义Web的知识发现方法研究[D].哈尔滨:哈尔滨工程大学,2008.
[48]李进华.网格环境下的分布式知识发现研究进展[J].情报理论与实践,2009(11):120-124.
[49]谌志群.文本趋势挖掘综述[J].情报科学,2010(2):316 320.
[50]黄晓斌,邓爱贞.现代信息管理的深化——数据挖掘和知识发现的发展趋势[J].现代图书情报技术,2003(4):1-3,16.
[51]余肖生,周宁,张芳芳.基于可视化数据挖掘的知识发现模型研究[J].中国图书馆学报,2006(5):44-46,56.
[52]李运景,任银玲,何琳,等.利用引文时序可视化挖掘专业学科发展规律[J].情报学报,2010(5):880-888.
[53]温有奎,徐国华,赖伯年,等.知识元挖掘[M].西安:西安电子科技大学出版社,2005.
[54]温有奎,焦玉英.基于知识元的知识发现[M].西安:西安电子科技大学出版社,2011.
[55]薛建武.为情报学与智能科学架起合作桥梁——评《基于知识元的知识发现》[J].情报理论与实践,2013(5):87-111.
[56]薛建武.为情报学与智能科学架起合作桥梁——评《基于知识元的知识发现》[J].情报理论与实践,2013(5):129.
[57]Garfield E.Citation indexes for science:a new dimension in documentation through the association of ideas[J].Science,1955(122):108 111.
[58]刘则渊,陈悦,侯海燕.科学知识图谱:方法与应用[M].北京:人民出版社,2008:33.
[59]李运景.期刊引文分析可视化的知识图谱构建研究[M].南京:东南大学出版社,2009:44-45.
[60]Hirsch,Jorge E.An index to quantify an individual's scientific research output[J].PNAS,2005:102(46):1656- 1657.
[61]叶鹰.一种学术排序新指数——f指数探析[J].情报学报,2009(1):142 149.
[62]叶鹰.对数f指数及其评价学意义[J].情报科学,2009(7):965 968.
[63]叶鹰.对数f指数及其评价学意义[J].情报科学,2009(7):965 968.
[64]普赖斯.科学的科学[M]//戈德史密斯,马凯主编,赵红洲,蒋国华,译,科学的科学.北京:科学出版社,1985:241-242.
[65]朱晓峰.知识管理研究综述[J].情报理论与实践,2003(5):406 408.
[66]姜颖,黄国彬.国外近两年有关本体研究的进展综述[J].图书馆学研究(应用版),2011(7):10-15.
[67]王知津,马婧,王璇.论知识组织的哲学基础及八大方法[J].图书馆理论与实践,2013(4):37-44.
[68]周子荣.云林佛教图书分类法[M].中国香港:云林出版社,2005.
[69]原小玲.基于知识元的知识标引[J].图书馆学研究,2007(6):45 47.
[70]温有奎,徐国华,赖伯年,等.知识元挖掘[M].西安:西安电子科技大学出版社,2005.
[71]朱庆华.《知识元挖掘》评介——兼议情报学的理论研究[J].情报科学,200624(12):1899 1902.
[72]韩松涛.目录学基本理论探讨[J].图书情报工作,2006(9):40 42.
[73]化柏林,张新民.从知识抽取相关概念辨析看知识抽取的特点和发展趋势[J].情报科学,2010(2):311-315.
[74]曹志杰,冷伏海.文献隐性关联知识发现研究[J].情报学报,2010(4):605-613.
[75]程鹏.知识发掘的概念及其相关理论研究[J].图书情报工作,2010(18):111-115.
[76]高新陵,王正兴.“十一五”期间我国文献情报领域知识发现研究综述[J].图书情报工作,2011(24):56-60.
[77]邱均平,周倩雯.数据挖掘与知识挖掘的比较研究[J].情报科学,2010(12):1862-1865.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。