首页 理论教育 常用人工智能技术在音乐数据分析中的应用

常用人工智能技术在音乐数据分析中的应用

时间:2023-11-18 理论教育 版权反馈
【摘要】:根据人工智能所属学科,可以把人工智能技术归类为回归分析、基于实例的方法、深度学习、关联规则学习、集成学习方法、贝叶斯理论、决策树、聚类方法、神经网络以及其他方法等。下面对常用的人工智能技术进行简单说明。

常用人工智能技术在音乐数据分析中的应用

人工智能人类利用机器设备来实现人的部分或全部智能的技术总称,人的智能包括感知能力、记忆能力、思维能力、学习能力、自适应能力、决策与行为能力等,目前为止,机器已经能模拟人类的许多功能,如计算能力、图像识别能力等。

根据人工智能所属学科,可以把人工智能技术归类为回归分析、基于实例的方法、深度学习、关联规则学习、集成学习方法、贝叶斯理论、决策树、聚类方法、神经网络以及其他方法等。其中回归分析包括普通最小二乘回归、线性回归、对数几率回归、逐步回归、多元自适应回归样条法、Jackknife回归、岭回归、主成分分析、主成分回归,偏最小二乘回归、Sammon Mapping等。

基于实例的方法包括K最近邻法、学习矢量量化、自组织映射、局部加权学习等。深度学习包括深度波尔兹曼机、深度信念网络、卷积神经网络、堆栈式自动编码器等。关联规则学习包括Apriori算法、Eclat算法、FP-Growth算法等。集成学习方法包括Logit Boost法、Bootstrapped Aggregation、AdaBoost、Stacked Generalization等。

贝叶斯决策理论包括朴素贝叶斯、高斯朴素贝叶斯、多项式朴素贝叶斯、贝叶斯网络等。决策树包括分类回归树、迭代二叉树3代ID3、C4.5和C5.0、卡方自动交互检测CHAID、单层决策树、M5模型、随机森林、条件决策树等。聚类方法包括层次聚类、模糊聚类、DBSCAN算法、OPTICS算法、非负矩阵分解算法、隐狄利克雷分布LDA等。神经网络包括自组织映射、感知机、反向传播算法、霍普菲尔德神经网络、径向基函数网络RBFN、自编码器AutoEncoders、玻尔兹曼机、受限玻尔兹曼机、Spiking神经网络、学习矢量量化LVQ等。

还有一些无法归类的方法,如支持向量机SVM、进化算法、归纳逻辑编程ILP、强化学习、PageRank算法、隐形马尔可夫模型、条件随机场等。

下面对常用的人工智能技术进行简单说明。

最近邻法(Nearest Neighbor)是一种应用广泛的分类器方法,该方法可以判断未知样本数据属于已知的几种分类中哪一类。通过计算未知的样本数据与已知样本数据的距离,找到与未知样本距离最近的已知样本,该已知样本的类别即为该未知样本的类别。应用于最近邻法的距离种类有切比雪夫距离、曼哈顿距离、欧式距离、闵可夫斯基距离、马氏距离、巴氏距离、汉明距离等。最近邻分类器的方法简单,效果明显,计算复杂度低,便于分类计算。

遗传算法(Genetic Algorithm)是由美国密歇根州立大学的J.Holland教授提出的一类借鉴生物界的进化规律演化而来的随机化搜索方法。它运用了生物学中的适者生存、优胜劣汰的遗传机制,对群体中的个体对象进行选择、交叉和变异操作,通过适应性函数来计算个体的适应度,自动获取和指导优化的搜索空间,自适应地调整搜索方向。遗传算法的基本过程包括:①初始化:设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0);②个体评价:计算群体P(t)中各个个体的适应度;③选择运算:选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代;④交叉运算:将交叉算子作用于群体;⑤变异运算:对群体中的个体串的某些基因座上的基因值做变动;⑥群体P(t)经过选择、交叉、变异运算之后得到下一代群体P(t+1);⑦终止条件判断:若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。遗传算法已被人们广泛地应用于组合优化、机器学习、信号处理、自适应控制和人工生命等领域

BP算法是在20世纪80年代中期由拉孟哈特(D.E.Rumellhart)等人发现的一种神经网络构造方法,它通过误差反向传播来不断校正多层神经网络之间的连接权重,达到优化网络的作用。从目标上讲,BP算法就是以不同形式的网络误差为目标函数、采用梯度下降法来计算目标函数的最小值;从结构上讲,应用BP算法的神经网络具有输入层、隐藏层和输出层。由于BP算法无须事先确定输入输出之间的映射关系,只需要通过自身的训练,学习某种规则,在给定输入值时得到最接近期望输出值的结果,因此BP算法具备了任意复杂的模式分类能力和优良的多维函数映射能力。BP算法的网络训练过程包括信号的前向传播和误差的反向传播两个过程,即计算整个网络的误差时按从输入层到输出层的正向传播顺序进行,调整网络连接的权值和阈值时按从输出层到输入层的反向传播顺序进行。网络训练具体实现步骤:①正向传播:输入信号从输入层通过隐含层作用于输出节点,经过非线性变换,产生输出信号;若实际输出与期望输出不相符,则转入误差的反向传播过程;②反向传播:误差反传是将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层所有单元,以从各层获得的误差信号作为调整相邻两层各单元间连接权值的依据;③训练终止:通过调整输入节点与隐层节点的联接强度和隐层节点与输出节点的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。经过训练的网络,可以应用于具体的场景中,这些场景包括:①函数逼近:用输入向量和相应的输出向量训练一个网络逼近一个函数;②模式识别:用一个待定的输出向量将它与输入向量联系起来;③分类:把输入向量所定义的合适方式进行分类;④数据压缩:减少输出向量维数以便于传输或存储等。(www.xing528.com)

贝叶斯决策理论是利用贝叶斯公式来求出新的场景下事件发生的概率,然后根据概率进行决策的过程。贝叶斯决策理论方法是统计模型决策中的一个基本方法,它能在不完全信息下,对部分未知的状态进行主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。它的基本过程是:①先得到已知类条件概率密度参数表达式和先验概率;②利用贝叶斯公式转换成后验概率;③再根据后验概率大小进行决策分类。贝叶斯决策判据既考虑了各类事件出现的概率大小,又考虑了因误判造成的损失大小,判别能力强,因此它适用于样本的数量不充分大的场合。

支持向量机(Support Vector Machine, SVM)是Corinna Cortes和Vapnik等于1995年首先提出的,是与相关的学习算法有关的监督学习模型,它是一种基于学习的分类模型。它可以分析数据,识别模式,用于分类和回归分析,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。

聚类分析(Cluster Analysis)是根据“物以类聚”的原理,对样本进行分类的一种多元统计分析方法。聚类分析在没有先验知识和可参考的模式下按样本的各自特性进行合理的分类,它是将样本分类到不同的类或者簇的过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学、计算机科学统计学、生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。聚类分析被应用于生活生产的很多方面。在商业上,聚类分析被用来发现不同的客户群,并且通过购买模式描述不同客户群的特征;在生物上,聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识;在地理上,聚类能够帮助在地球中被观察的数据之间的相似性;在保险行业上,聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型、价值、地理位置来鉴定一个城市的房产分组;在网络应用上,聚类分析被用来在网上进行文档归类来修复信息。

关联规则是人工智能数据挖掘领域的热门研究方法之一,主要是指在业务系统中搜索所有能把一组事件或数据项与另一组事件或数据项联系起来的规则,以获取新的信息并为决策提供数据支持。关联规则首先由R.Agrawal等人[64]在1993年提出,并建立项目集格空间理论,提出了著名的Apriori算法。关联规则最初是针对购物篮分析(Market Basket Analysis)问题提出的,通过分析购物篮可以了解顾客的购物习惯,开发更好的营销策略,调整商品的展示方式,从而改善顾客的购物体验,提高商店的运行效率。经典的关联规则挖掘方法有基于广度搜索策略的Apriori算法和基于深度搜索策略的FP Growth算法、ECLAT算法、COFI算法等。

深度学习的概念源于人工神经网络的研究,包含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出,基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外LeCun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。

深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如,一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。

深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如,图像、声音和文本。同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分,不同的学习框架下建立的学习模型存在一定差异。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈