亚洲免费在线视频-亚洲啊v-久久免费精品视频-国产精品va-看片地址-成人在线视频网

您的位置:首頁技術文章
文章詳情頁

python爬取鏈家二手房的數據

瀏覽:45日期:2022-06-18 17:08:08
目錄一、查找數據所在位置:二、確定數據存放位置:三、獲取html數據:四、解析html,提取有用數據:一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python爬取鏈家二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python爬取鏈家二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息url = ’https://nj.lianjia.com/ershoufang/pg{}/’.format(page)# 請求urlresp = requests.get(url, headers=headers, timeout=10)四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, ’lxml’)# 篩選全部的li標簽sellListContent = soup.select(’.sellListContent li.LOGCLICKDATA’)# 循環遍歷for sell in sellListContent: # 標題 title = sell.select(’div.title a’)[0].string # 先抓取全部的div信息,再針對每一條進行提取 houseInfo = list(sell.select(’div.houseInfo’)[0].stripped_strings) # 樓盤名字 loupan = houseInfo[0] # 對樓盤的信息進行分割 info = houseInfo[0].split(’|’) # 房子類型 house_type = info[1].strip() # 面積大小 area = info[2].strip() # 房間朝向 toward = info[3].strip() # 裝修類型 renovation = info[4].strip() # 房屋地址 positionInfo = ’’.join(list(sell.select(’div.positionInfo’)[0].stripped_strings)) # 房屋總價 totalPrice = ’’.join(list(sell.select(’div.totalPrice’)[0].stripped_strings)) # 房屋單價 unitPrice = list(sell.select(’div.unitPrice’)[0].stripped_strings)[0]

以上就是我的分享,如果有什么不足之處請指出,多交流,謝謝!

以上就是python爬取鏈家二手房的數據的詳細內容,更多關于python爬取鏈家二手房的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 亚洲国产精品久久网午夜 | 久久精品九九 | 久久久久久亚洲精品影院 | 在线国产视频 | 久久久国产99久久国产首页 | 国产成人免费全部网站 | 99视频精品在线 | 亚洲国产天堂久久精品网 | 99视频九九精品视频在线观看 | 亚洲免费观看 | 久久久久琪琪精品色 | 久久久久久久国产精品 | 久草久热| 国产一级一片免费播放视频 | 操12p| 波多久久夜色精品国产 | 国产成人精品一区二区免费 | 国产成人精品福利网站在线 | 日韩毛片免费在线观看 | 国产成人狂喷潮在线观看2345 | 成人自拍网 | 在线看欧美成人中文字幕视频 | 亚洲第一男人天堂 | 久久久精品2018免费观看 | 成人禁在线观看午夜亚洲 | 成人伊人青草久久综合网 | 欧美一级毛片欧美一级成人毛片 | 女人夜色黄网在线观看 | avtt亚洲一区中文字幕 | 亚洲欧美一区二区久久香蕉 | 色偷偷亚洲女人天堂观看欧 | 欧美在线观看一区 | 亚洲人成影院在线高清 | 91精品国产免费 | 能直接看的一级欧美毛片 | 一本大道香蕉久在线不卡视频 | 国产手机在线小视频免费观看 | 午夜欧美成人香蕉剧场 | 韩国巨胸女三级视频网 | 香港一级特黄高清免费 | 成人影视免费 |