首页 理论教育 基于概率图模型的监狱大数据分析与挖掘技术

基于概率图模型的监狱大数据分析与挖掘技术

时间:2023-08-06 理论教育 版权反馈
【摘要】:提出一种全新的基于隐含狄利克雷分配模型、吉布斯采样和条件随机域模型的监狱大数据进行分析与挖掘技术模型,能有效地识别重要数据之间属性关联,以及发现稳定的潜在模式。概率图模型是图论与概率论的完美结合,提供了一个可以统一现有很多数据挖掘算法的框架,并赋予了它们新的理解。概率图模型处理了应用数学和工程中两个重要问题:复杂性和不确定性,将众多经典的多变量数据挖掘算法或模型统一到概率图模型的框架中去。

基于概率图模型的监狱大数据分析与挖掘技术

针对应急指挥综合管理平台收集的监狱内部各种数据,进行业务数据分析处理,利用隐马尔科夫模型和因子图模型构建各类数据之间的影响关系有向图。提出一种全新的基于隐含狄利克雷分配模型、吉布斯采样和条件随机域模型的监狱大数据进行分析与挖掘技术模型,能有效地识别重要数据之间属性关联,以及发现稳定的潜在模式。

数据仓库,英文名称为Data Warehouse,自20世纪90年代提出后至今发展十分迅速。数据仓库之父William Inmon 将其定义为:面向主题的、集成的、相对稳定的、反映历史变化的数据集合,为企业和机构提供需要业务智能来指导业务流程改进和监视时间、成本、质量和控制。

随着数据仓库研究的不断深入,国内外涌现出了许多研究与应用成果,其中IBM 公司提出的商业智能(BI)概念是最为重要的革新与突破。以数据仓库为基础,发现有用信息的方法与产品在商业中已逐渐成熟并初露锋芒,但数据仓库在政务系统中的应用还处于探索阶段,对于政务系统的可行性、必要性分析以及针对政务系统特殊性的探讨与改进有待进一步尝试。(www.xing528.com)

数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题。数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示这三个步骤。数据准备是从相关的数据源中选取所需的数据并整合成用于数据挖掘的数据集;规律寻找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。

概率图模型是图论概率论的完美结合,提供了一个可以统一现有很多数据挖掘算法框架,并赋予了它们新的理解。概率图模型处理了应用数学和工程中两个重要问题:复杂性和不确定性,将众多经典的多变量数据挖掘算法或模型统一到概率图模型的框架中去。例如混合模型(Mixture Model),Ising Model 以及隐马尔可夫模型(Hidden Markov Model)。外国研究人员分析了连续型犯罪人员的犯罪记录,提取了犯罪动机、犯罪频率、犯罪事件和犯罪严重程度等4 类特征,进行了犯罪人员的聚类分析和行为预测,为监狱人员对服刑犯罪人员的管理提供了宝贵的指导意见。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈