首页 直播 App
当前位置: 首页 > 大数据工程师 > 大数据工程师文章 > 数据挖掘常用算法及特点有哪些?

数据挖掘常用算法及特点有哪些?

发布时间:2021-03-02 15:18 来源:环球网校 点击量: 1238

大数据工程师报名、考试、查分时间 免费短信提醒

地区:

获取验证 立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

【导读】为了进行数据挖掘,数据科学家们提出了各种模型,在众多的数据挖掘模型中,国际权威学术组织ICDM筛选出了十个最常用的算法。那么,数据挖掘常用算法及特点有哪些呢?今天就跟随小编一起来了解下吧!

数据挖掘常用算法及特点有哪些.png

1、C4.5算法,就是决策树算法,它创造性的可以在决策过程中就进行预剪枝,并且可以处理连续的属性,也可以对不完整的数据进行处理。

2、朴素贝叶斯模型是基于概率论的原理,它的思想是对未知物体分类的时候需要求解这个未知物体出现在各个条件下的概率,那个大就属于哪一类,比如天气和田七,文章中出现中药后出现田七的概率明显高于天气。

3、SVM又叫支持向量机,英文名是Support Vector Machine,简称SVM,适合超平面分类模型。

4、KNN也叫临近算法,就是每个样本可以用它最接近的K个邻居来代表,如果几个样本距离A 的范围很近,那样本都可以归属于A。

5、AdaBoost相当与一个联合提升算法,将多个效果弱的分类器一起联合使用以达到提升效果的目的。

6、Apriori是一种挖掘关联规则的算法,通过挖掘经常出现在一起的集合来揭示之间的关系。

7、CART代表分类和回归树,建立两棵树,一棵是分类树,一棵是回归树,属于一种决策学习的方法。

8、EM算法也称为大期望算法,是求参数最大似然估计的一种方法。原理是这样的,如果想要评估参数A和参数B,在开始的状态下二者都是未知的,但是知道了A可以得到B信息,反过来也是如此,可以先赋值A然后的到B的估值,然后从Bde估值重新计算A,过程持续,直到收敛为止。

9、K-Means算法是一个聚类算法,可以理解为先设置一个中心点,然后计算与中心的距离,距离那个近,就归属于那个类别。

10、PageRank是一种类似于论文影响力的计算方式,一篇论文呗引用的次数越多即代表他的影响力越强,goole搜索引擎ed排序方法也是类似的原理,这也是goole搜索引擎更能搜到你想要的内容的原因。

以上就是小编今天给大家整理分享关于“数据挖掘常用算法及特点有哪些?”的相关内容希望对大家有所帮助。小编认为要想在大数据行业有所建树,需要考取部分含金量高的数据分析师证书,这样更有核心竞争力与竞争资本。


  • 张方

    19:00-20:00 19:00-20:00 05月21日 19:00-20:00

    建筑人如何把握职场“新”赛道

    一级建造师

  • 环球网校

    19:00-19:51 19:00-19:51 05月23日 19:00-19:51

    课代表直播|晋升-混凝土工程创效

    一级建造师

  • 黄静

    19:00-20:30 19:00-20:30 05月23日 19:00-20:30

    转战评估考试 如何多证联动备考

    一级建造师

出版物经营许可证|京B2-20210770| 京公网安备 11010802033350号|京ICP备16038139号|节目制作经营许可证(京)字20130号|京网文(2021)2566-713号
知春路校区:北京市海淀区知春路7号致真大厦D座4层北区(地铁10号线西土城出A口)|邮编:100191
版权所有 2003-2021 北京环球创智软件有限公司|联系客服|营业执照