【摘要】:降维胡邵华等用一种自编码网络实现了对经典的“瑞士卷”数据的重构。图8.2 “瑞士卷”重构“瑞士卷”数据是经典的机器学习中难于分类的数据之一,其隐含的数据内在模式难以在二维数据中描述。图8.3 深度网络提取音乐的特征实现思路非常简单,用上述层叠的多个RBM网络组成深度网络结构来提取音乐的特征。深度网络是一种良好的机器学习方法,其特征提取功能能够针对不同概念的粒度大小,在很多领域都得到广泛的应用。
由于AE可以对原始数据在不同概念的粒度上进行抽象,一种自然的深度网络的应用是对数据进行压缩(或者叫降维)。
(1)降维
胡邵华等用一种自编码网络实现了对经典的“瑞士卷”数据的重构(见图8.2)。

图8.2 “瑞士卷”重构
“瑞士卷”数据是经典的机器学习中难于分类的数据之一,其隐含的数据内在模式难以在二维数据中描述。然而,胡邵华等采用深度置信网络实现了对三维瑞士卷数据的2维表示,其自编码网络结点大小依次为3-100-50-25-10-2。具体的实现细节参考有关文献。
(2)特征提取(https://www.xing528.com)
通过训练一个5层的深度网络提取音乐的特征,用于音乐风格的分类,其分类精度比基于梅尔倒谱系数(MFCC)特征分类的方法提高了14个百分点(见图8.3)。

图8.3 深度网络提取音乐的特征
实现思路非常简单,用上述层叠的多个RBM网络组成深度网络结构来提取音乐的特征。输入的原始数据是经过分帧、加窗之后的信号的频谱。分类器采用的是支持向量机(SVM)。对比的方法则是提取MFCC特征系数,分类器同样采用SVM。更多的细节和实验结果可以参考有关文献。
深度网络是一种良好的机器学习方法,其特征提取功能能够针对不同概念的粒度大小,在很多领域都得到广泛的应用。通常,DBN对一维数据的建模比较有效,例如语音。而通过级联多层卷积网络组成深度网络的模型主要用于二维数据建模,例如图像等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
