首页 新闻 搜索 专区 学院

正则表达式,匹配HTML的img标签

1
悬赏园豆:50 [已解决问题] 解决于 2012-02-06 13:51
正则表达式,匹配HTML的img标签,最终要取到alt和id里面的值(在后台C#代码实现),
<[img]+\s+(.*?)alt=[\s'"](?<alt>\w*?)[\s'"](.*?)id=[\s'"](?<id>\w*?)[\s'"](.*?)>

上面的正则表达式可以匹配到下面两个

<img alt="3" id="1" src="abc.png">
<img alt="31" id="3" src="http://localhost:1580/BookManagement-1/Admin/ReadImage.aspx" />

如果我想要匹配下面的字符串(注意有换行),应该怎么修改上面表达式或者写个新的表达式

<img alt=3D"31" id=3D"3" =
src=3D"http://localhost:1580/BookManagement-1/Admin/ReadImage.aspx" />
zemin1的主页 zemin1 | 初学一级 | 园豆:180
提问于:2012-02-05 23:41
< >
分享
最佳答案
1

用这样的。在你的那上面改了改。

<[img]+([^>]*?)alt=[^>](?<alt>[^>]*?)id=[^>](?<id>[^>]*?)[\\s\'\"](.*?)>
收获园豆:45
LCM | 大侠五级 |园豆:6876 | 2012-02-06 00:36

谢谢,问题已得到解决,还有利用下面这个也可以

<img\s+.*?(?<=alt=)(?<alt>.*?)(?=[\s]).*?(?<=id=)(?<id>.*?)(?=[\s])([\s\S]*?)>

后来才知道我那是经过Base64编码的字符串,解码后再匹配应该也是可以实现的

zemin1 | 园豆:180 (初学一级) | 2012-02-06 13:49
其他回答(1)
0

哇 html经过QP(Quote-Printable)编码了的啊

收获园豆:5
喵喵喵猫 | 园豆:1742 (小虾三级) | 2012-02-06 13:21

经过Base64编码,我应该解码后再匹配的,thank you all the same.

支持(0) 反对(0) zemin1 | 园豆:180 (初学一级) | 2012-02-06 13:51
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册