当前位置:首页 » 《随便一记》 » 正文

聚类分类应用题

10 人参与  2022年11月07日 15:53  分类 : 《随便一记》  评论

点击全文阅读


读取“农村居民人均可支配收入来源 2016.xlsx”数据表,其中数据来源于 2016 年《中国统计年鉴》,对表中给出的我国内陆 31 个地区做 K-均值聚类分析(K=4),并在控制台中输出聚类结果和各个类的聚类中心。

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

from sklearn.cluster import KMeans

data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')

x=data.iloc[1:31,1:5]

x

#计算k均值聚类

kmeans = KMeans(n_clusters=4, random_state=0).fit(x)
#簇中心坐标

center = kmeans.cluster_centers_
plt.scatter(x,x)

plt.show()

#4个聚类中心,运行算法10次,取最优值。

kmeans_rnd_10_inits = KMeans(n_clusters=4, init="random", n_init=10,

                              algorithm="full", random_state=2)

kmeans_rnd_10_inits.fit(x)

k = 4

kmeans = KMeans(n_clusters=k, random_state=31)

y_pred = kmeans.fit_predict(x)

kmeans.cluster_centers_

X_new = np.array(x)

kmeans.predict(X_new)

kmeans.transform(X_new)

#4个聚类中心,运行算法10次,取最优值。

kmeans_rnd_10_inits = KMeans(n_clusters=4, init="random", n_init=10,

                              algorithm="full", random_state=2)

kmeans_rnd_10_inits.fit(x)


                                                                               


点击全文阅读


本文链接:http://zhangshiyu.com/post/47287.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1