首页 理论教育 常用包和方法分类总结

常用包和方法分类总结

时间:2023-06-28 理论教育 版权反馈
【摘要】:(1)聚类常用的包:fpc,cluster,pvclust,mclust基于划分的方法:kmeans,pam,pamk,clara基于层次的方法:hclust,pvclust,agnes,diana基于模型的方法:mclust基于密度的方法:dbscan基于画图的方法:plotcluster,plot.hclust基于验证的方法:cluster.stats(2)分类常用的包:rpart,party

常用包和方法分类总结

(1)聚类

常用的包:fpc,cluster,pvclust,mclust

基于划分的方法:kmeans,pam,pamk,clara

基于层次的方法:hclust,pvclust,agnes,diana

基于模型的方法:mclust

基于密度的方法:dbscan

基于画图的方法:plotcluster,plot.hclust

基于验证的方法:cluster.stats

(2)分类

常用的包:rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,sur-vival

决策树:rpart,ctree

随机森林:cforest,randomForest

回归:Logistic,Poisson,glm,predict,residuals

生存分析:survfit,survdiff,coxph

(3)序列模式

常用的包:arulesSequences,timsac,zoo

SPADE算法:cSPADE

常用的包:timsac

时间序列构建函数:ts

成分分解:decomp,decompose,stl,tsr

(4)统计

常用的包:Base R,nlme

方差分析:aov,anova

密度分析:density

假设检验:t.test,prop.test,anova,aov

线性混合模型:lme(www.xing528.com)

主成分分析和因子分析:princomp

方差分析对应的是Kruskal-Wallis秩和检验:kruskal.test

T检验对应的是Wilcoxon符号秩和检验R:wilcox.test

随机微分方程模拟和统计推断:sde

非参数平滑与分布估计:KernSmooth

用来方便地做MLE估计:stats4

非线性方程求根、ODE均衡状态解:rootSolve

非线性优化:Rsolnp

(5)机器学习

神经网络:nnet,deepnet,RcppDL,autoencoder,neuralnet,RSSNS,Rdbn,AMORE,MXNetR,darch,H2O

支持向量机SVM:e1071

核函数:kernlab

(6)数据库

连接ODBC数据库接口:RODBC

连接轻量级SQLite数据库连接:RSQLite

像写SQL语句一样对数据框做操作:sqldf

(7)NLP

词汇数据库:Wordnet

命名实体识别:openNLP,KoNLP

分词:Snowball/Rwordseg(分词http://R-Forge.R-project.org)

词干化:Rstem

文本挖掘:RTextTool,textact,Isa,tm

主题模型:topicmodel

关键词提取:tau,gsubfn,RKEA

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈