改章节是一篇关于数据挖掘分类的帖子
硕士读了快一年了一直专注于系统开发方向,尤其是分布式和数据库这一块,身旁其他很多同寅都是数据发掘这个方向,耳濡目染,最近学习了数据发掘的相干内容,忽然认为还是蛮有意思的货色,在这里对数据发掘领域的相干经典算法做一个综述,日后一一详解。
一、分类算法
#1. C4.5
#2. CART(Classification and Regression Tree)分类和回归树
#3. K Nearest N'ei'ghbours(KNN)K近邻
#4. Naive Bayes 朴实贝叶斯
二、统计学习
#5. SVM(Support Vector Machine) 支撑向量机
#6. EM(Expectation Maximization) 最大期望
三、关联分析
#7. Apriori
#8. FP-Tree(Frequent Pattern Tree) 频繁模式树
四、链接发掘
#9. PageRank
#10. HITS
五、聚类
#11. K-Means
#12. BIRCH
六、Bagging and Boosting
#13. Adaboost
七、Sequential Pattern(序列模式)
#14. GSP(generalized sequential pattern)
每日一道理
时间好比一条小溪,它能招引我们奔向生活的海洋;时间如同一叶扁舟,它将帮助我们驶向理想的彼岸;时间犹如一支画笔,它会指点我们描绘人生的画卷。
#15. PrefixSpan
八、完整性发掘
#16. CBA(Classification Based on Association)关联分类
九、粗糙集
#17. Finding Reduct (知识约简)