首页 > 开发 > Python > 正文

python正则匹配筛出来元组

2017-09-06 19:39:13  来源:网友分享

抓人人相册图片
特征是data-src="URL" URL里包括large_和original_的
我本来是
flist=re.findall('data-src="(.*?large_.*?)"',str)
改成
flist=re.findall('data-src="(.*?(large_|original_).*?)"',str)
筛出来list里是元组
正则应该怎么写好

解决方案

data-src="http://fmn.rrimg.com/fmn059/20111102/...
随便看了下,还是没找到带original_的。

(?<=data-src=")[^"]*?(?:large_|original_){1}[^"]*?(?=")

应该可以,在你给的链接里面找到10个。