亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術文章
文章詳情頁

python - 網(wǎng)頁title中包含換行,如何用正則表達式提取出來?

瀏覽:135日期:2022-06-28 10:07:00

問題描述

在用python做CSDN的網(wǎng)頁爬蟲,在爬取網(wǎng)頁title時,我一直用的正則表達式(?<=<title>).+?(?=<)在CSDN中用不了了,去CSDN源碼一看,title換行顯示了python - 網(wǎng)頁title中包含換行,如何用正則表達式提取出來?

所以導致原來的正則表達式無法使用,那么,問題來了,像這樣網(wǎng)頁title中包含換行,如何用正則表達式提取出來呢?

PS:

不想用xpath或beautifulsoup的方法,只需要正則哦

CSDN本身有反爬蟲機制,我并不是因為這個反爬蟲而爬不到title的哦

謝謝大家

參照@caimaoy 的方法,我將正則表達式改為 (?<=<title>)(?:.|n)+?(?=<)后,title完美提取。再次感謝大家。

問題解答

回答1:

re.M 多行模式

自己寫多行匹配 http://python3-cookbook.readt...

回答2:

表達式那邊加個flag吧

tite = ’......’print(re.findall(’(?<=<title>).+?(?=<)’, title, re.S))

標簽: Python 編程
主站蜘蛛池模板: 日本无卡码免费一区二区三区 | 免费一级特黄特色黄大任片 | 亚洲第一男人天堂 | 亚洲精品二区中文字幕 | 成人 欧美 | 国产美女一区二区 | 国产精品综合久成人 | 波多野结衣一区二区三区在线观看 | 日本韩国一区 | 国亚洲欧美日韩精品 | 一级看片 | 成人黄色免费 | 精品国产免费一区二区三区 | 久草久草| 中文字幕亚洲天堂 | 自拍偷拍欧美视频 | 亚洲综合成人在线 | 在线观看二区三区午夜 | 国产精品91在线 | 欧美极度另类 | 性理论片 | 久草新| 在线观看一级毛片免费 | 亚洲欧美日韩国产精品26u | 亚洲精品在线免费观看视频 | 国产90后美女露脸在线观看 | 久久合| 中文字幕福利片 | 欧美日韩精品一区二区 | 国产一区二区三区美女在线观看 | 国产xh98hx在线观看 | 亚洲国产一区二区三区四区五区 | 99热久久国产综合精品久久国产 | 国产黄色片在线观看 | 美女黄页黄频 | 亚洲一级毛片中文字幕 | 国产精品拍拍拍福利在线观看 | 国产日韩欧美综合在线 | 国产日韩在线播放 | 国产99视频精品免费视频免里 | 92看片淫黄大片一级 |