色综合图-色综合图片-色综合图片二区150p-色综合图区-玖玖国产精品视频-玖玖香蕉视频

您的位置:首頁技術文章
文章詳情頁

Python:UserWarning:此模式具有匹配組。要實際獲得組,請使用str.extract

瀏覽:7日期:2022-08-07 13:30:45
如何解決Python:UserWarning:此模式具有匹配組。要實際獲得組,請使用str.extract?

中的至少一個正則表達式模式urls必須使用捕獲組。 str.contains僅針對其中的每一行返回True或Falsedf[’event_time’]-不使用捕獲組。因此,UserWarning警告您正則表達式使用捕獲組,但未使用匹配項。

如果要刪除,則UserWarning可以從正則表達式模式中找到并刪除捕獲組。它們沒有顯示在您發布的正則表達式模式中,但是它們必須在您的實際文件中。在字符類之外查找括號。

或者,您可以通過以下方式禁止此特定的UserWarning

import warningswarnings.filterwarnings('ignore', ’This pattern has match groups’)

在致電之前str.contains。

這是一個簡單的示例,演示了問題(和解決方案):

# import warnings# warnings.filterwarnings('ignore', ’This pattern has match groups’) # uncomment to suppress the UserWarningimport pandas as pddf = pd.DataFrame({ ’event_time’: [’gouda’, ’stilton’, ’gruyere’]})urls = pd.DataFrame({’url’: [’g(.*)’]}) # With a capturing group, there is a UserWarning# urls = pd.DataFrame({’url’: [’g.*’]}) # Without a capturing group, there is no UserWarning. Uncommenting this line avoids the UserWarning.substr = urls.url.values.tolist()df[df[’event_time’].str.contains(’|’.join(substr), regex=True)]

版畫

script.py:10: UserWarning: This pattern has match groups. To actually get the groups, use str.extract. df[df[’event_time’].str.contains(’|’.join(substr), regex=True)]

從正則表達式模式中刪除捕獲組:

urls = pd.DataFrame({’url’: [’g.*’]})

避免了UserWarning。

解決方法

我有一個數據框,我嘗試獲取字符串,其中的列上包含一些字符串Df像

member_id,event_path,event_time,event_duration30595,'2016-03-30 12:27:33',yandex.ru/,130595,'2016-03-30 12:31:42',030595,'2016-03-30 12:31:43',yandex.ru/search/?lr=10738&msid=22901.25826.1459330364.89548&text=%D1%84%D0%B8%D0%BB%D1%8C%D0%BC%D1%8B+%D0%BE%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD&suggest_reqid=168542624144922467267026838391360&csg=3381%2C3938%2C2%2C3%2C1%2C0%2C0,'2016-03-30 12:31:44','2016-03-30 12:31:45','2016-03-30 12:31:46','2016-03-30 12:31:49',kinogo.co/,'2016-03-30 12:32:11',kinogo.co/melodramy/,0

和另一個帶有網址的df

url003.ru/[a-zA-Z0-9-_%$#?.:+=|()]+/mobilnyj_telefon_bq_phoenix003.ru/[a-zA-Z0-9-_%$#?.:+=|()]+/mobilnyj_telefon_fly_003.ru/sonyxperia003.ru/[a-zA-Z0-9-_%$#?.:+=|()]+/mobilnye_telefony_smartfony003.ru/[a-zA-Z0-9-_%$#?.:+=|()]+/mobilnye_telefony_smartfony/brands5D5Bbr_231click.ru/sonyxperia1click.ru/[a-zA-Z0-9-_%$#?.:+=|()]+/chasy-motorola

我用

urls = pd.read_csv(’relevant_url1.csv’,error_bad_lines=False)substr = urls.url.values.tolist()data = pd.read_csv(’data_nts2.csv’,error_bad_lines=False,chunksize=50000)result = pd.DataFrame()for i,df in enumerate(data): res = df[df[’event_time’].str.contains(’|’.join(substr),regex=True)]

但它還給我

UserWarning: This pattern has match groups. To actually get the groups,use str.extract.

我該如何解決?

標簽: Python 編程
主站蜘蛛池模板: 97视频免费公开成人福利 | 欧美一级毛片免费播放aa | 华人色 | 成人合成mv福利视频网站 | 免费看成人播放毛片 | 亚洲第一免费视频 | 久久毛片免费看一区二区三区 | 欧美精品videos | 欧美特级午夜一区二区三区 | 三级网站在线免费观看 | 亚洲看片 | 高清性色生活片欧美在线 | 日韩国产欧美一区二区三区 | 国产午夜三区视频在线 | 国产精品一区在线播放 | 精品视自拍视频在线观看 | 久久久久久久久免费影院 | 目韩一区二区三区系列片丶 | 美国一级毛片免费看成人 | 精品久久一区二区三区 | 成人69视频在线观看免费 | 色樱桃影院亚洲精品影院 | 亚洲天堂视频网 | 亚洲国产欧美91 | 欧美亚洲精品在线 | 国产亚洲精品久久麻豆 | 波多野一区二区三区在线 | 欧美一级高清免费播放 | 欧美 亚洲 另类 自拍 在线 | 九九色网站 | 日本精品一区二区三区在线视频一 | 久久久国产免费影院 | 国产高清视频在线观看 | 久久成人精品免费播放 | 欧美理论大片清免费观看 | 午夜亚洲 | 国产午夜爽爽窝窝在线观看 | 国产三级精品三级国产 | 久草视频福利 | 伊人国产在线视频 | 黄色a网|