public static StringBuilder GetImgUrl(string text) { StringBuilder str = new StringBuilder(); string pat = @"<img\s+[^>]*\s*src\s*=\s*([']?)(?<url>\S+)'?[^>]*>"; Regex r = new Regex(pat, RegexOptions.Compiled); Match m = r.Match(text); //int matchCount = 0; if (m.Success) { Group g = m.Groups[2]; str.Append(g); m = m.NextMatch(); } ...... }
省略号代表一些个性化的处理 比如截取出来多了 /或者多了.什么的 你可以使用字符串的replace等方法给干掉
实际开发中远比楼主你这个要复杂,我这个是爬电商的图片正则,如果下载的源文件之有一个img 一个src 那么就简单许多了,楼主自己多试试吧。
不知道楼主是怎么取操作这个的,webrequest读取的,还是js端的操作 ?
http://htmlagilitypack.codeplex.com/