亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

javascript - nodejs抓取網(wǎng)頁(yè)的問(wèn)題

瀏覽:137日期:2023-09-13 15:18:42

問(wèn)題描述

我準(zhǔn)備抓用nodejs抓取下面這個(gè)網(wǎng)站的所有新聞, 按照一般的思路,是首先取得每頁(yè)新聞的URL,然后取得每個(gè)新聞的URL按照使用request把每個(gè)網(wǎng)址的內(nèi)容取下來(lái)就OK了.

但是下面的這個(gè)網(wǎng)址的所有分頁(yè)信息, 還有每個(gè)新聞點(diǎn)擊進(jìn)去URL都沒(méi)有任何變化, 貌似都是在后臺(tái)通過(guò)js實(shí)現(xiàn)的.用chrome的F12的newwork的tab也查看不到有什么請(qǐng)求,有哪位大神能指導(dǎo)一下我怎么來(lái)抓取嗎?

http://www.xxxxxxxxx.com/glob...

問(wèn)題解答

回答1:

1.從上一篇與下一篇的地方可以看到,click綁定的函數(shù):boardView(1);

2.通過(guò)boadrview在頁(yè)面中找到對(duì)應(yīng)的函數(shù):

function boardView(idx){ var listNum = 10; // ?? ? ?? var resultLenplistNum = Math.floor(idx/listNum); // ?? ??? ??? var resultLenRestlistNum = Math.floor(idx%listNum); // ?? ??? ??? if (resultLenRestlistNum == 0){ pageNum = resultLenplistNum; } else { pageNum = resultLenplistNum + 1; } cmsView.style.display = ’block’; cmsList.style.display = ’none’; resultViewStr = ’<p class='news_view'><p class='news_hd'>’; resultViewStr = resultViewStr + ’<strong>’+list.artCatTitles[resultSearch[idx]] +’</strong>’; resultViewStr = resultViewStr + ’<p>’+list.artTitles[resultSearch[idx]]+’</p>’; resultViewStr = resultViewStr + ’<span>’+list.artTimes[resultSearch[idx]]+’</span></p>’; resultViewStr = resultViewStr + ’<p class='news_bd'>’+list.artTexts[resultSearch[idx]]; resultViewStr = resultViewStr + list.artFiles[resultSearch[idx]]+’</p>’; resultViewStr = resultViewStr + ’<p class='news_link'><ul>’; resultViewStr = resultViewStr + ’<li><strong><span></span>’;

.........

3.看到數(shù)據(jù)來(lái)自于list這個(gè)變量,再尋找list

4.在1739行看到:

var artId = '';var catId = 'se14_24';var tplId = '';list = new jsList();list.cmsInit(catId, artId, tplId, new data()); // list ?? ??

5.調(diào)用了一個(gè)構(gòu)造函數(shù):jsList()找到相應(yīng)的代碼在這里:http://www.samsungsem.com/js/...

6 看回第2步的代碼:list.artTitles-->這些數(shù)據(jù)是通過(guò)jsList的cmsInit方法設(shè)置的,而cmsInit中:

function cmsInit(catId, artId, tplId, data) { this.artIds = data.artIds; this.artCatTitles = data.artCatTitles; this.artTitles = data.artTitles; this.artUrls = data.artUrls; this.artTimes = data.artTimes; this.artImgs = data.artImgs; this.artTexts = data.artTexts; this.artTexts2 = data.artTexts2; this.artKeywords = data.artKeywords; this.artFiles = data.artFiles;

...的數(shù)據(jù)來(lái)自第四個(gè)參數(shù)data

7.再看第4步的傳的data是new data()于是,我們找到data這個(gè)函數(shù)定義的地方。往上找,找到了:<script src='http://m.lshqa.cn/global/news/data.js.jsp'></script>

8.打開(kāi)后看一下:http://www.samsungsem.com/glo... 好奇怪的感覺(jué),怎么樣式那么奇怪?

再右鍵查看源代碼:view-source:http://www.samsungsem.com/glo...可以看到data函數(shù)是在這里定義的,而你看到的數(shù)據(jù)也在這個(gè)頁(yè)面里。

回答2:

多謝回答,我先去看看去.....

基本看明白了,還有一點(diǎn)不是很懂的地方再慢慢去看,多謝了..

標(biāo)簽: JavaScript
相關(guān)文章:
主站蜘蛛池模板: 国产一级片播放 | 亚洲无线一二三区2021 | 久久久国产一区二区三区 | 午夜宅男在线永远免费观看网 | 国产一级做a爰片在线看 | 久久香蕉国产线看观看精品yw | 精品热线九九精品视频 | 一区二区三区四区在线播放 | 成人亚洲欧美日韩在线 | 性欧美video另类bd | 久久久久久久久久久福利观看 | 亚洲国产成人va在线观看网址 | 国产美女精品一区二区三区 | 亚洲国产成a人v在线 | 日韩精品免费看 | 久久国产一片免费观看 | 怡红院老首页主页入口 | 洋老外米糕国产一区二区 | 国产一级视频久久 | 免费国产99久久久香蕉 | 国产三级成人 | 日本色中色| 免费狼人久久香蕉网 | 久久草在线观看 | 亚洲男人第一天堂 | 日韩一区二区三 | 成人三级在线播放线观看 | 色偷偷亚洲第一成人综合网址 | 一区不卡在线观看 | 欧美一级在线免费观看 | 精品xxxxxbbbb欧美中文 | 男人天堂网在线视频 | 欧美成人猛男性色生活 | 国产精品夜色视频一级区 | 久久久999国产精品 久久久99精品免费观看 | 一级视频在线 | 国产成人精品区在线观看 | 国产一区在线免费观看 | 美女很黄很黄 | 亚洲一区免费观看 | 国产一区二区免费播放 |