色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

Python實現JS解密并爬取某音漫客網站

瀏覽:3日期:2022-07-07 13:23:29

首先打開網站

https://www.zymk.cn/1/37988.html

打開開發者工具

Python實現JS解密并爬取某音漫客網站

選擇XHR標簽頁,沒有找到什么

再查看一下這些圖片的URL值

http://mhpic.xiaomingtaiji.net/comic/D%2F%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9%E6%8B%86%E5%88%86%E7%89%88%2F20%E8%AF%9D%2F1.jpg-zymk.middle.webp

嘗試搜索圖片元素

Python實現JS解密并爬取某音漫客網站Python實現JS解密并爬取某音漫客網站

發現有一個js文件,打開搜索

Python實現JS解密并爬取某音漫客網站

發現這里有一個疑點,這不是html里面的字段嗎,那么 “i.getPicUrl(e)” 不就是那個圖片的URL的值了嗎

在這里下一個斷點,走你

Python實現JS解密并爬取某音漫客網站

果然,這個就那個圖片URL生成的切入點,現在就是看調用棧,找到這個函數的起點,點擊右側的 ”e.init“,這里有一個setInitData函數,從名字來看,應該就是設置初始數據的地方,在這里下一個斷點,進去看看

Python實現JS解密并爬取某音漫客網站

這里有一個this.imgpath,這個應該就是圖片的URL值了,點擊F10,再單步調式,來到了charcode函數

Python實現JS解密并爬取某音漫客網站

進去看看,這里應該就是加密函數了

Python實現JS解密并爬取某音漫客網站

這里一步步調式,不要著急,來到了這里

Python實現JS解密并爬取某音漫客網站

繼續單步調式,在第二次打開這么VM文件的時候,”__cr.imgpath“這個看起來很熟悉呀

Plain Text'L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N:8-M@-IN-AL-:N'

打開頁面源代碼,就在這里啦,不僅僅有圖片的URL加密值,還有其他數據,這些都是在后面圖片URL拼接需要使用到的

Python實現JS解密并爬取某音漫客網站

現在我們再重新看看那個加密函數,它無非就是遍歷那個加密值的每個字符,獲取其Unicode值,再與__cr.chapter_id進行相關運算,然后再得到的Unicode數值返回字符

現在我們可以用python仿寫這個算法

Python實現JS解密并爬取某音漫客網站

接下就是平常get請求獲取必要的數據了,通過正則獲取元素,拼接,以下是源碼

Python實現JS解密并爬取某音漫客網站

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 久久r视频 | 欧美在线视频一区二区 | 亚洲一区二区三区免费在线观看 | 亚洲欧美一区二区三区在线观看 | 成人黄网18免费观看的网站 | 在线免费看a | 亚洲精品成人av在线 | 夜色成人性y| 亚洲精品国产一区二区三 | 久久九九免费视频 | 最近韩国日本免费免费版 | 精品三级在线观看 | 欧美日韩精品在线视频 | 午夜欧美日韩在线视频播放 | 中国日本高清免费视频网 | 亚洲国产精品第一区二区 | 99免费精品视频 | 视频在线一区二区三区 | 一级美女黄色片 | 久久九九国产精品怡红院 | 一区二区三区不卡在线 | 久久免费观看国产精品 | 久久综合九九亚洲一区 | 亚洲精品国产一区二区在线 | 亚洲精品美女在线观看播放 | 亚洲欧美视屏 | 亚洲精品高清在线观看 | 在线免费视频国产 | 色日韩在线 | 农村寡妇野外情一级毛片 | 久久精品国产99久久 | 国产v片在线播放免费观 | 免费观看一级欧美大 | 国产一区国产二区国产三区 | 国产末成年女噜噜片 | a级毛片在线视频免费观看 a级免费 | 一级美国片免费看 | 亚洲欧美人妖另类激情综合区 | 久久99国产亚洲精品观看 | 亚洲欧美日韩综合二区三区 | 亚洲成aⅴ人片在线影院八 亚洲成av人片在线观看 |