亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術文章
文章詳情頁

python - 對於不同文件夾的特徵提取策略問題

瀏覽:104日期:2022-08-11 08:43:16

問題描述

問題描述:

有很多文件夾,一個文件夾下有很多文件。目的是將每個文件夾的特徵提取出來,特徵規定是該文件夾下的一個或少量文件(名,內容hash及相對位置)。有什麼較好的算法或策略來解決該問題嗎?

我想的是暴力求解,但這效率低下。直接把該文件夾下的文件與其它文件夾下所有的文件做比較,如果有相同的,則該文件夾的下一個文件又去比較其它所有的,如果不同,則說明這個文件可以表達出該文件夾的特征。然后每個文件夾都這么做。

統計方法。按順序將每個文件夾的文件排序,選最大最小及中位數文件來作每個文件夾的特徵。但會出現這麼個問題,兩個文件夾可能就只有一個或少量文件不同,使用這種策略會產生遺漏,無法準確提取出所有文件夾的特徵。

因此,我希望是在既能保證效率又能保證準確率的情況下來對這問題進行求解。希望各位表哥能隨便提提建議或意見,指導指導。thx。

問題解答

回答1:

將當前文件夾隨機取固定數目個文件,將他們的文件名、大小、修改時間、權限等組合起來做個哈希,然后判重,一般重復率是不會很高的,因為即使文件名和大小一樣,修改時間一般是不一樣的。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美一区二区三区精品国产 | 久久思| 99久久成人 | 国产亚洲欧美在线人成aaaa | 欧美视频一区二区三区在线观看 | 精品国产综合区久久久久99 | 欧美一区二| 国产a级午夜毛片 | 99久久国产免费福利 | 欧美不卡一区 | 成人免费高清视频 | 国产后式a一视频 | 色综合久久88色综合天天小说 | 久草社区视频 | 精品91一区二区三区 | 一区二区三区四区在线视频 | 黄色一级毛片 | 悟空影视大全免费影视 | 中文毛片| 久久久久国产精品免费网站 | 欧美 日韩 国产在线 | 色噜噜国产精品视频一区二区 | 欧美xxxx成人免费网站 | 国产高清在线精品一区二区 | www伊人| 日韩字幕一中文在线综合 | 国产伦精品一区二区三区 | 日韩 欧美 自拍 | 欧美亚洲国产成人精品 | 欧美日韩亚洲在线观看 | 国产uv1区二区三区 国产va免费精品高清在线观看 | 国产女乱淫真高清免费视频 | 久久久久久中文字幕 | 国产成人综合日韩精品无 | 波多野结衣在线观看一区二区 | 午夜香蕉网 | 日韩一级在线播放免费观看 | 亚洲成a人在线观看 | 亚洲成人偷拍 | 国产成人yy精品1024在线 | 欧美日韩第三页 |