色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

python - sklearn如何訓(xùn)練大規(guī)模數(shù)據(jù)集

瀏覽:146日期:2022-06-27 16:56:25

問(wèn)題描述

問(wèn)題一:

現(xiàn)在我有40多萬(wàn)條的數(shù)據(jù),需要對(duì)該數(shù)據(jù)使用某種機(jī)器學(xué)習(xí)分類算法建立模型,遇到的問(wèn)題是因?yàn)閿?shù)據(jù)過(guò)于龐大不能一次性的進(jìn)行數(shù)據(jù)的讀取,所以想問(wèn)一下該如何處理數(shù)據(jù)?

問(wèn)題二:

關(guān)于sklearn交叉驗(yàn)證有個(gè)疑問(wèn):假如我有10000個(gè)訓(xùn)練數(shù)據(jù),由交叉驗(yàn)證原理可以將這一萬(wàn)個(gè)訓(xùn)練數(shù)據(jù)集使用KFold方法分成n組訓(xùn)練(train數(shù)據(jù)占0.7),現(xiàn)在搞不明白的就是我對(duì)第一組的訓(xùn)練集進(jìn)行fit(),然后對(duì)測(cè)試集進(jìn)行預(yù)測(cè)驗(yàn)證得到預(yù)測(cè)的準(zhǔn)確率,但是得到預(yù)測(cè)準(zhǔn)確率有什么用呢?會(huì)對(duì)下一次的訓(xùn)練有影響嗎?還有就是上一次的訓(xùn)練模型會(huì)被用到下一次的fit()函數(shù)嗎?

問(wèn)題解答

回答1:

我最近在學(xué)大數(shù)據(jù)的數(shù)據(jù)挖掘與分析這一塊,對(duì)于問(wèn)題一,我有個(gè)思路你參考一下:既然無(wú)法一次性讀取,可以建立分布式數(shù)據(jù)模型,分次讀取數(shù)據(jù),確定地址datanode(可以是某個(gè)變量名),建立一個(gè)namenode(名字與該地址對(duì)應(yīng)的表),然后獲取數(shù)據(jù)的時(shí)候,先在namenode中確認(rèn)地址(需要的是哪一個(gè)變量對(duì)應(yīng)的數(shù)據(jù)),再訪問(wèn)該地址獲取數(shù)據(jù)進(jìn)行處理。由于初學(xué),我只是提供下我個(gè)人的思路,答案不唯一,僅供參考,各路大牛不喜勿噴。

回答2:

40萬(wàn)沒(méi)多少啊,頂多幾G吧......如果真的是內(nèi)存小到8G也沒(méi)有,那還是得看你具體場(chǎng)景啊,舉個(gè)列子,單純算tf-idf,一個(gè)generator,內(nèi)存中只有最后的tf-idf字典。

交叉驗(yàn)證只是為了選取誤差最小的一個(gè),你提到的前面的影響后面,是boosting的概念。

回答3:

這種問(wèn)答網(wǎng)站最好是一個(gè)問(wèn)題一個(gè)坑,必要時(shí)兩個(gè)分開的問(wèn)題給連結(jié)連相關(guān)性,避免 Double-barreled question

(1) 見How to optimize for speed,你會(huì)發(fā)現(xiàn)有很多可以調(diào)控試驗(yàn)的方式,包括(a)儘量使用簡(jiǎn)單的演算法計(jì)巧 (b)針對(duì)現(xiàn)實(shí)狀況做記憶體使用及速度的側(cè)寫 (c)試著用Numpy陣列取代所有nested loops (d)必要時(shí)使用Cython Wrapper 去調(diào)更有效率的C/C++函數(shù)庫(kù)。這些只是基本原則和方向,實(shí)際上還是要看你要操作問(wèn)題的瓶頸分析,是速度還是空間,把代碼最佳化後再考慮是否要用平行計(jì)算等手段

(2) 你這問(wèn)題得區(qū)分 數(shù)學(xué) 和 實(shí)證 上要求的差異,希望你對(duì) 過(guò)擬合(overfitting)及 underfitting的 實(shí)證及數(shù)學(xué)意義有所掌握,這裡的問(wèn)答還蠻不錯(cuò)的,讀一下有幫助的。

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 特级毛片免费观看视频 | 欧美成人一区二区三区 | 久久精品国产精品亚洲毛片 | 日本高清视频免费在线观看 | 毛片3| 欧美亚洲国产精品久久久 | 欧美日韩亚洲高清不卡一区二区三区 | 色综合亚洲七七久久桃花影院 | 亚洲伊人色一综合网 | 中文字幕一级毛片 | 日本暖暖在线视频 | 免费看成人毛片 | 国产欧美一区二区三区观看 | 国产成人精品高清在线观看99 | 久久国产午夜精品理论片34页 | 男人天堂网在线观看 | 欧美高清在线精品一区 | 99re在线精品视频 | 国产偷国产偷亚洲高清在线 | 欧美成免费 | 欧美理论片在线观看一区二区 | 国产日本在线视频 | 久草com | 久久久亚洲欧洲日产国码二区 | 中文字幕一区视频一线 | 美美女高清毛片视频免费观看 | 成年人免费视频观看 | 99热热久久这里只有精品166 | 亚洲国产成人在线视频 | 国产激情一区二区三区 | 亚洲成人自拍网 | 国产精品秒播无毒不卡 | 国产一级aaa全黄毛片 | 免费看欧美一级特黄a毛片 免费看片aⅴ免费大片 | 99国产成人高清在线视频 | 国产在线欧美日韩一区二区 | 特黄特级a级黄毛片免费观看多人 | 成人在线一区二区 | 美国一级毛片oo | 男女视频在线看 | 手机看片自拍自自拍日韩免费 |