首页 新闻 会员 周边 捐助

关于正则表达式提取HTML图片

0
悬赏园豆:20 [已解决问题] 解决于 2014-12-10 17:31

@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>"

 

Regex re = new Regex(regex, RegexOptions.IgnoreCase | RegexOptions.IgnorePatternWhitespace | RegexOptions.Multiline);

 

 

这个正则我是在博客园找到的,位置http://www.cnblogs.com/xiaoyao2011/archive/2011/09/25/2190013.html#commentform

但是我发现有些图片地址含有空格(不能匹配的原因我已经标出)  则不能匹配到  

<IMG border=0 hspace=0 alt="" src="C:\Users\Public\Pictures\Sample Pictures\Penguins.jpg" align=baseline>

请问  如何修改啊!!!!

xuliyuan173的主页 xuliyuan173 | 菜鸟二级 | 园豆:249
提问于:2014-12-10 10:30
< >
分享
最佳答案
0

<img\b[^>]*?\bsrc[\s]*=[\s]*["']?[\s]*(?<imgUrl>[^"'>]*)[^>]*?/?[\s]*>

换行、空格问题都解决了。 

收获园豆:10
问天何必 | 老鸟四级 |园豆:3311 | 2014-12-10 10:42

谢谢  能用  谢谢

xuliyuan173 | 园豆:249 (菜鸟二级) | 2014-12-10 11:06
其他回答(2)
0

<img[^<]*src="[^<]*"[^<]*>

收获园豆:5
Yu | 园豆:12990 (专家六级) | 2014-12-10 10:34

 你原来那个是可以用的,你是不是没有忽略大小写啊,如 IMG img

支持(0) 反对(0) Yu | 园豆:12990 (专家六级) | 2014-12-10 10:38

@Yu: 不是啊  我可能没有写清楚  我忽略了大小写  只是路径中含有空格 所以不能匹配

支持(0) 反对(0) xuliyuan173 | 园豆:249 (菜鸟二级) | 2014-12-10 10:41

@xuliyuan173:  我这可以匹配

支持(0) 反对(0) Yu | 园豆:12990 (专家六级) | 2014-12-10 12:25
0

有可能的话最好用类似Jquery 选择器的技术,具体请参考我博客里最新的文章。

收获园豆:5
XiaoFaye | 园豆:3087 (老鸟四级) | 2014-12-10 10:37

谢谢

支持(0) 反对(0) xuliyuan173 | 园豆:249 (菜鸟二级) | 2014-12-10 10:48
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册