亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

<ul id="260ae"><dfn id="260ae"></dfn></ul>

<ul id="260ae"></ul>

<del id="260ae"></del>

<fieldset id="260ae"></fieldset>

<strike id="260ae"><input id="260ae"></input></strike>

文章詳情頁(yè)

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

瀏覽：15日期：2022-07-09 18:38:13

第一步.隨機(jī)生成質(zhì)心

由于這是一個(gè)無(wú)監(jiān)督學(xué)習(xí)的算法，因此我們首先在一個(gè)二維的坐標(biāo)軸下隨機(jī)給定一堆點(diǎn)，并隨即給定兩個(gè)質(zhì)心，我們這個(gè)算法的目的就是將這一堆點(diǎn)根據(jù)它們自身的坐標(biāo)特征分為兩類，因此選取了兩個(gè)質(zhì)心，什么時(shí)候這一堆點(diǎn)能夠根據(jù)這兩個(gè)質(zhì)心分為兩堆就對(duì)了。如下圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

第二步.根據(jù)距離進(jìn)行分類

紅色和藍(lán)色的點(diǎn)代表了我們隨機(jī)選取的質(zhì)心。既然我們要讓這一堆點(diǎn)的分為兩堆，且讓分好的每一堆點(diǎn)離其質(zhì)心最近的話，我們首先先求出每一個(gè)點(diǎn)離質(zhì)心的距離。假如說(shuō)有一個(gè)點(diǎn)離紅色的質(zhì)心比例藍(lán)色的質(zhì)心更近，那么我們則將這個(gè)點(diǎn)歸類為紅色質(zhì)心這一類，反之則歸于藍(lán)色質(zhì)心這一類，如圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

第三步.求出同一類點(diǎn)的均值，更新質(zhì)心位置

在這一步當(dāng)中，我們將同一類點(diǎn)的xy的值進(jìn)行平均，求出所有點(diǎn)之和的平均值，這個(gè)值（x,y）則是我們新的質(zhì)心的位置，如圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

我們可以看到，質(zhì)心的位置已經(jīng)發(fā)生了改變。

第四步.重復(fù)第二步，第三步

我們重復(fù)第二步和第三部的操作，不斷求出點(diǎn)對(duì)質(zhì)心的最小值之后進(jìn)行分類，分類之后再更新質(zhì)心的位置，直到得到迭代次數(shù)的上限（這個(gè)迭代次數(shù)是可以我們自己設(shè)定的，比如10000次），或者在做了n次迭代之后，最后兩次迭代質(zhì)心的位置已經(jīng)保持不變，如下圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

這個(gè)時(shí)候我們就將這一堆點(diǎn)按照它們的特征在沒(méi)有監(jiān)督的條件下，分成了兩類了??！

五.如果面對(duì)多個(gè)特征確定的一個(gè)點(diǎn)的情況，又該如何實(shí)現(xiàn)聚類呢？

首先我們引入一個(gè)概念，那就是歐式距離，歐式距離是這樣定義的，很容易理解：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

很顯然，歐式距離d(xi,xj)等于我們每一個(gè)點(diǎn)的特征去減去另一個(gè)點(diǎn)在該維度下的距離的平方和再開(kāi)根號(hào)，十分容易理解。

我們也可以用另一種方式來(lái)理解kmeans算法，那就是使某一個(gè)點(diǎn)的和另一些點(diǎn)的方差做到最小則實(shí)現(xiàn)了聚類，如下圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

得解!

六：代碼實(shí)現(xiàn)

我們現(xiàn)在使用Python語(yǔ)言來(lái)實(shí)現(xiàn)這個(gè)kmeans均值算法，首先我們先導(dǎo)入一個(gè)名叫make_blobs的數(shù)據(jù)集datasets，然后分別使用兩個(gè)變量X,和y進(jìn)行接收。X表示我們得到的數(shù)據(jù),y表示這個(gè)數(shù)據(jù)應(yīng)該被分類到的是哪一個(gè)類別當(dāng)中，當(dāng)然在我們實(shí)際的數(shù)據(jù)當(dāng)中不會(huì)告訴我們哪個(gè)數(shù)據(jù)分在了哪一個(gè)類別當(dāng)中，只會(huì)有X當(dāng)中數(shù)據(jù)。在這里寫代碼的時(shí)候比較特殊，make_blobs庫(kù)要求我們必須接受這兩個(gè)參數(shù)，不能夠只接受X這個(gè)數(shù)據(jù)參數(shù)，代碼如下

plt.figure(figsize=(15,15))#規(guī)定我們繪圖的大小為12*12X, y=make_blobs(n_samples=1600,random_state=170)#一共取用1600個(gè)sample,同時(shí)狀態(tài)設(shè)定為隨機(jī)#不知道這個(gè)狀態(tài)隨機(jī)是什么意思，只能查有關(guān)這個(gè)庫(kù)的官方文檔，同時(shí)這個(gè)數(shù)據(jù)集規(guī)定了是具備三個(gè)數(shù)據(jù)中心，也就是三個(gè)簇y_pred=KMeans(n_clusters=3,random_state=170).fit_predict(X)plt.subplot(221)#表示四個(gè)方格當(dāng)中的第一格plt.scatter(X[:,0],X[:,1],c=y_pred)#表示數(shù)據(jù)的第0個(gè)和第1個(gè)維度，同時(shí)數(shù)據(jù)的colour與predict的結(jié)果有關(guān)plt.title('The result of the Kmeans')plt.subplot(222)#表示四個(gè)方格當(dāng)中的第一格plt.scatter(X[:,0],X[:,1],c=y)plt.title('The Real result of the Kmeans')array=np.array([[0.60834549,-0.63667341],[-0.40887178,-0.85253229]])lashen=np.dot(X,array)y_pred=KMeans(n_clusters=3,random_state=170).fit_predict(lashen)plt.subplot(223)#表示四個(gè)方格當(dāng)中的第一格plt.scatter(lashen[:,0],lashen[:,1],c=y_pred)#表示數(shù)據(jù)的第0個(gè)和第1個(gè)維度，同時(shí)數(shù)據(jù)的colour與predict的結(jié)果有關(guān)plt.title('The Real result of the tranfored data')

我們?cè)谑褂胹catter函數(shù)進(jìn)行繪圖的時(shí)候會(huì)根據(jù)我們數(shù)據(jù)結(jié)的形狀來(lái)編寫相應(yīng)的代碼，這里我們所拿到的X數(shù)據(jù)集的行數(shù)是我們所指定的1600行，因?yàn)槲覀円还材玫搅?600個(gè)數(shù)據(jù)，每一個(gè)數(shù)據(jù)僅有兩個(gè)特征，也就是在XY軸當(dāng)中的坐標(biāo)，因此X是一個(gè)二維的ndarray對(duì)象（X是numpy當(dāng)中的ndarray對(duì)象），我們可以打印出來(lái)看看這個(gè)數(shù)據(jù)的構(gòu)成，如下圖所示：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

同時(shí)我們也可以看到y(tǒng)也是ndarray對(duì)象，由于我們?cè)诓杉瘮?shù)據(jù)的時(shí)候僅僅接受了3個(gè)簇，make_blobs默認(rèn)接受的是三個(gè)簇（或稱cluster）的緣故，因此最后y的值只有0，1，2這三種可能。我們通過(guò)matplotlib繪圖，繪制出我們分類的結(jié)果圖，也就是上述代碼的運(yùn)行結(jié)果如下：

Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)

以上就是Kmeans均值聚類算法原理以及Python如何實(shí)現(xiàn)的詳細(xì)內(nèi)容，更多關(guān)于Kmeans均值聚類算法的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：Python:__eq__和__str__函數(shù)的使用示例下一條：python實(shí)現(xiàn)sm2和sm4國(guó)密(國(guó)家商用密碼)算法的示例

相關(guān)文章：

1. 改變 Python 中線程執(zhí)行順序的方法2. Python 如何將integer轉(zhuǎn)化為羅馬數(shù)(3999以內(nèi))3. 詳解Python模塊化編程與裝飾器4. Python下使用Trackbar實(shí)現(xiàn)繪圖板5. html小技巧之td,div標(biāo)簽里內(nèi)容不換行6. Python通過(guò)format函數(shù)格式化顯示值7. python web框架的總結(jié)8. 以PHP代碼為實(shí)例詳解RabbitMQ消息隊(duì)列中間件的6種模式9. python使用ctypes庫(kù)調(diào)用DLL動(dòng)態(tài)鏈接庫(kù)10. Python性能測(cè)試工具Locust安裝及使用

排行榜

					
					關(guān)于Java下奇怪的Base64詳解
Python 如何將integer轉(zhuǎn)化為羅馬數(shù)(3999以內(nèi))
Python使用shutil模塊實(shí)現(xiàn)文件拷貝
如何在vue3.0+中使用tinymce及實(shí)現(xiàn)多圖上傳文件上傳公式編輯功能
Spring security 自定義過(guò)濾器實(shí)現(xiàn)Json參數(shù)傳遞并兼容表單參數(shù)(實(shí)例代碼)
SpringBoot Shiro 權(quán)限注解不起作用的解決方法
Effective java學(xué)習(xí)筆記4:避免創(chuàng)建重復(fù)對(duì)象
python+adb+monkey實(shí)現(xiàn)Rom穩(wěn)定性測(cè)試詳解
java 如何實(shí)現(xiàn)正確的刪除集合中的元素
JAVA判斷空值方法原理解析
編寫更好的 Java 單元測(cè)試的 7 個(gè)技巧
				

熱門標(biāo)簽

主站蜘蛛池模板：精品一区二区三区在线观看l | 国产精品亚洲视频 | 久久久亚洲精品蜜桃臀 | 在线国产区 | 在线视免费频观看韩国aaa | 扒开两腿猛进入爽爽视频 | 4438全国最大成人网视频 | 久久综合香蕉久久久久久久 | 久久久久久免费一区二区三区 | 国产免费v片在线看 | 波多野结衣在线免费观看视频 | 精品无码久久久久国产 | 亚洲欧美另类色妞网站 | 久久久日本久久久久123 | 免费看一级做a爰片久久 | 日本一区二区三区高清福利视频 | 国产三级精品在线 | 国产成人一区二区三区在线播放 | 欧美国产大片 | 新版天堂中文资源8在线 | 在线中文字幕日韩欧美 | 色欲麻豆国产福利精品 | 日本久久久久久久久久 | 亚洲成人一区二区 | 日本欧美韩国一区二区三区 | 中文字幕亚洲综合久久男男 | 国产免费高清在线精品一区 | 国产成人亚洲日本精品 | 日本无卡码一区二区三区 | 欧美视频一级 | 免费一区二区三区久久 | 涩里番资源网站在线观看 | 成人免费一区二区三区在线观看 | 美女色黄网站 | a一级免费 | 国产精品久久久久网站 | 国产人做人爱视频精品 | 日本色中色 | 国产日韩精品欧美一区喷 | 最新中文字幕乱码在线 | 看美国毛片 |

<tfoot id="y2y0i"><input id="y2y0i"></input></tfoot>

<tfoot id="y2y0i"><input id="y2y0i"></input></tfoot>

<fieldset id="y2y0i"></fieldset>

<strike id="y2y0i"></strike>

<strike id="y2y0i"></strike>