首页 理论教育 图情大数据:国内外主要专利分析工具软件

图情大数据:国内外主要专利分析工具软件

时间:2023-08-08 理论教育 版权反馈
【摘要】:在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这类不易于直接参与专利分析的非结构化数据。表6-1所示为国内外主要的专利分析工具软件。

图情大数据:国内外主要专利分析工具软件

专利是衡量科技创新能力的最为重要的指标之一,是国家、城市及企业的科技发展核心竞争力的重要体现。2014年8月,国务院发布了《关于加快发展生产性服务业促进产业结构调整升级的指导意见》,指出:开展面向生产性服务业企业的知识产权培训、专利运营、分析评议、专利代理和专利预警等知识服务。专利运营、分析评议、专利预警等都是专利大数据挖掘分析的研究成果,不仅企业需要通过专利大数据挖掘为自身的生产经营活动提供技术创新的支撑和决策参考,政府部门也需要借助专利大数据挖掘服务未来的产业发展布局、重大项目立项、创新资源投入等科学决策,咨询机构更需要依托专利大数据挖掘,开展高质量的可行性研究、风险评估、价值分析、投融资分析等。专利大数据的价值日益被社会各界所重视,基于专利大数据挖掘的产业专利导航、企业专利战略、重大项目知识产权分析评议、专利预警、专利地图等专利数据研究和服务产品,也逐步成为政府、企业所重点关注的知识服务产品。

专利大数据挖掘是指以某一领域的专利文献信息为分析样本,结合网络、报纸、期刊、学位论文等各类非专利文献信息,通过与诉讼过程、企业经营活动、经济效益、社会效益、市场因素、宏观环境等信息进行关联研究,通过提炼、比较、概括和归纳,上升为一种支撑技术创新的知识服务过程。

在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这类不易于直接参与专利分析的非结构化数据。自然语言处理(NLP)是近年来大数据和机器学习兴起后的一项热门技术,其中,文本挖掘可以针对性地分析大量文本内容,满足很多实际需求,正适用于批量处理专利信息中的非结构化数据,从中提取出有价值的信息,也可以进一步转换为结构化数据,作为新的维度与其他结构化数据共同分析。

专利信息的分析方法研究可分为定性分析方法和定量分析方法两类。专利信息定性分析方法包括技术形态分析方法、SAO语义方法和专家评分方法。专利信息中,如果专利内容是基于原理的,则这项技术还不成熟;如果专利内容主要基于用途的多样性,则意味着该技术已得到实际应用。专利信息定量分析方法主要包括时间序列法、回归法、聚类法、社会网络法和神经网络法等。

目前对专利文献信息开展较多的是文本聚类等数据挖掘算法研究,对技术热点进行文本聚类和引证分析,将专利文献中的申请人、发明人、法律状态等信息与基金、项目、学术活动等关系数据库中的结构化数据和半结构化数据进行关联、快速抓取和可视化分析并推送给对此感兴趣的用户。同时,随着人工智能和云计算技术的不断发展,领域知识本体技术的不断成熟,基于语义学的专利数据挖掘将成为专利信息分析的一个新的发展方向。

表6-1所示为国内外主要的专利分析工具软件。

表6-1 国内外主要的专利分析工具软件

(www.xing528.com)

(续表)

(续表)

(续表)

(续表)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈