<a href="http://www.huishangbao.com/buy/show-45266.html" target="_blank"><strong class="px14">求购含氯<span class="highlight">除尘</span>灰</strong></a>在这个代码中用正则表达式得到网址和标题,怎么做的?
C#代码如下:
string strText = "<a href=\"http://www.huishangbao.com/buy/show-45266.html\" target=\"_blank\"><strong class=\"px14\">求购含氯<span class=\"highlight\">除尘</span>灰</strong></a>";
Regex reg = new Regex("<a href=\"(http://[a-z]*.*/*-*\\d*)\"\\starget=\"_blank\"><strong class=\"px14\">(.*)<span");
if (reg.IsMatch(strText))
{
Match m = reg.Match(strText);
string aa = m.Groups[1].ToString();//http://www.huishangbao.com/buy/show-45266.html
string bb = m.Groups[2].ToString();//求购含氯
}
写正则表达式可以会有点复杂,建议使用xml解析的方式。