我需要一个正则表达式判断 字符串是否在html标签的外部,并且要把这个字符串抠出来
例如:
<img src="...." title="XX" />...XX...<a>...
需要把外面的XX给扣出来, 也有可能XX外面没有标签
我写了半天,老是不严谨! [^<]\w*(key)\w*[^>]
你说什么啊,不明.什么可能XX外面没有标签啊?
这样?
>[^<>]*(纠结)[^<>]*<
取group1
分都不给,走了!
可以选择过滤所有HTML标签, SourceString = Regex.Replace(SourceString, "<(.|\n)+?>", "")
得到的将是你想要的 XX 内容
http://www.cnblogs.com/zhuwenlong/archive/2010/08/13/1798676.html
<[^>]+>过滤所以html标签
(?<=<(\S*)[^>]*?>).*?(?=</\1>)