您现在的位置: > 行业杂谈 > weka中的聚类算法
weka中的聚类算法
weka作为一种非常实用的数据挖掘算法,其中的聚类分析算法是它整个架构中最能够化龙点睛的一笔,也最能够体现数据挖掘的真谛,要想熟练的使用数据挖掘工具weka,并对数据挖掘的一系列思路能够有一个大概的了解,对于其中的聚类算法做一个深入的了解是十分必要的。了解这些算法的思想对于香港vps的使用者理解集群算法也是十分有帮助的。
现在首先先来介绍以下什么是聚类算法:聚类算法的目的是进行聚类分析,一般认为它起源于分类学,以相似性为基础,聚在同一个聚类中的模式之间一般会比聚在不在聚类中的模式之间更具相似性,聚类分析通常是由若干模式组成的,模式一般是一个可以用来度量的向量,也有可能是多维空间中的一个点。可以用来作为一个单独的工具发现数据库中分布的一些深层的信息,并且概括出每一类的特点以作进一步的分析。
以下来介绍以下weka当中常用的聚类算法:
1)2-1KMeans
最早是由JamesMacQueen提出的"K-Means"算法,这个被应用得最广泛的基于划分的聚类算法,其实是一种硬聚类算法KMens,是基于原型的、划分的聚类技术,试图划分用户指定个数k的簇,思想是:以空间中k个点为中心进行聚类,通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。
2)EM
EM与KMeans方法类似,是KMeans方法的一个扩展,它不是把对象分配给一个确定的簇,而是根据对象与簇之间的隶属关系发生的概率来分配对象。
3)DBSCAN
DBSCAN是一种基于密度的聚类算法,簇的个数由算法根据数据的状态自动确定。将低密度区域中的点视为噪声而忽略,因此DBSCAN无法产生完全的聚类。
如果您还有什么不明确或者是不懂的地方,欢迎来新世界主机咨询了解,详情请咨询QQ: TEL: 。我们必将竭诚为您服务。
本文地址:
http://xgvps.com/xingyezatan/409.htm
版权所有*转载时必须以链接形式注明作者和原始出处
Copyright © 2001-2020 香港vps 网址:http://xgvps.com/
香港vps、香港服务器、香港vps主机、香港vps哪里好、就到香港新世界vps主机。
信息来源于网络以及网友投稿,如侵犯了您的权益,请及时通知本站。