首页 新闻 会员 周边 捐助

python正则,大神,帮忙看看, 万分感谢。

0
悬赏园豆:10 [已解决问题] 解决于 2018-04-21 16:05
<font color="#000000">

<img width="147" height="52"src="http://127.0.0.1:80/admin/../upload/pimg1054_1.png" alt="" />
<img width="147"height="52" src="admin/../upload/asffas_ad.jpg" alt="" />

</font>


大神, 用re正则, 怎么将img标签里边的 alt属性,width属性, 给去除掉啊?

                                万分感谢!!

WrYcF的主页 WrYcF | 初学一级 | 园豆:21
提问于:2018-04-21 10:52

你的意思是把 alt ="XX" 这个里面的XX去掉吗?

BUTTERAPPLE 6年前

@BUTTERAPPLE: 不是, 是直接把alt这个属性给去掉.

WrYcF 6年前
< >
分享
最佳答案
0

Code Below:

import re


regex = r"(src|alt)=[\"](.*?)[\"]"

test_str = '<img width=\"147\" height=\"52\"src=\"http://127.0.0.1:80/admin/../upload/pimg1054_1.png\" alt=\"\" />'

subst = ""

result = re.sub(regex, subst, test_str, 0)

if result:
    print(result)
# Result:
<img width="147" height="52"  />
收获园豆:10
BUTTERAPPLE | 老鸟四级 |园豆:3190 | 2018-04-21 15:52

感谢大神指点,谢谢,万分感谢。

WrYcF | 园豆:21 (初学一级) | 2018-04-21 16:04
其他回答(1)
0

其实如果你用python正则的来搞网页爬取的话,完全可以借用一些其他模块,有点模块能够直接找出img,并且有去除属性功能

随风行云 | 园豆:936 (小虾三级) | 2018-04-21 13:45

大神,不是搞爬取,是数据清理一下, 

支持(0) 反对(0) WrYcF | 园豆:21 (初学一级) | 2018-04-21 15:17
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册