(1)聚类
常用的包:fpc,cluster,pvclust,mclust
基于划分的方法:kmeans,pam,pamk,clara
基于层次的方法:hclust,pvclust,agnes,diana
基于模型的方法:mclust
基于密度的方法:dbscan
基于画图的方法:plotcluster,plot.hclust
基于验证的方法:cluster.stats
(2)分类
常用的包:rpart,party,randomForest,rpartOrdinal,tree,marginTree,maptree,sur-vival
决策树:rpart,ctree
随机森林:cforest,randomForest
回归:Logistic,Poisson,glm,predict,residuals
生存分析:survfit,survdiff,coxph
(3)序列模式
常用的包:arulesSequences,timsac,zoo
SPADE算法:cSPADE
常用的包:timsac
时间序列构建函数:ts
成分分解:decomp,decompose,stl,tsr
(4)统计
常用的包:Base R,nlme
方差分析:aov,anova
密度分析:density
假设检验:t.test,prop.test,anova,aov
线性混合模型:lme(www.xing528.com)
主成分分析和因子分析:princomp
方差分析对应的是Kruskal-Wallis秩和检验:kruskal.test
T检验对应的是Wilcoxon符号秩和检验R:wilcox.test
随机微分方程模拟和统计推断:sde
非参数平滑与分布估计:KernSmooth
用来方便地做MLE估计:stats4
非线性方程求根、ODE均衡状态解:rootSolve
非线性优化:Rsolnp
(5)机器学习
神经网络:nnet,deepnet,RcppDL,autoencoder,neuralnet,RSSNS,Rdbn,AMORE,MXNetR,darch,H2O
支持向量机SVM:e1071
核函数:kernlab
(6)数据库
连接ODBC数据库接口:RODBC
连接轻量级SQLite数据库连接:RSQLite
像写SQL语句一样对数据框做操作:sqldf
(7)NLP
词汇数据库:Wordnet
命名实体识别:openNLP,KoNLP
分词:Snowball/Rwordseg(分词http://R-Forge.R-project.org)
词干化:Rstem
文本挖掘:RTextTool,textact,Isa,tm
主题模型:topicmodel
关键词提取:tau,gsubfn,RKEA
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。