效果:
文本中的内容是HTML页面,用文件流写成HTML文件之前,想提取所有A标签<a href="http://aaa.com/?from=300300" target="_blank">
<a href="http://aaa.com/?from=300300" target="_blank">
<a href="http://aaa.com/?from=300300" target="_blank">
<a href="http://aaa.com/b/?from=300300" target="_blank">
提取并替换之后
<a href="http://aaa.com/b/?from=乱码" target="_blank">
<a href="http://aaa.com/b/?from=乱码" target="_blank">
<a href="http://aaa.com/b/?from=乱码" target="_blank">
<a href="http://aaa.com/b/?from=乱码" target="_blank">
public static string ReplaceQuery(string query, string key, string newvalue)
{
Regex reg = new Regex("(?<=" + key + "=).*?(?=&|$)", RegexOptions.IgnoreCase);
return reg.Replace(query, newvalue);
}
把正则换上楼上的试试
再请教一下,如何把被替换之前的提取出来呢?
提取A的正则:<a[^<]+>|</a>
之后呢?