首页 新闻 会员 周边 捐助

.NET后台提取HTML文本中的标签,并替换。

0
悬赏园豆:20 [已解决问题] 解决于 2012-11-01 16:17

效果:

文本中的内容是HTML页面,用文件流写成HTML文件之前,想提取所有A标签<a href="http://aaa.com/?from=300300" target="_blank">

<a href="http://aaa.com/?from=300300" target="_blank">

<a href="http://aaa.com/?from=300300" target="_blank">

<a href="http://aaa.com/b/?from=300300" target="_blank">

提取并替换之后

<a href="http://aaa.com/b/?from=乱码" target="_blank">

<a href="http://aaa.com/b/?from=乱码" target="_blank">

<a href="http://aaa.com/b/?from=乱码" target="_blank">

<a href="http://aaa.com/b/?from=乱码" target="_blank">

假扮天使的主页 假扮天使 | 初学一级 | 园豆:30
提问于:2012-10-31 17:25
< >
分享
最佳答案
1

 public static string ReplaceQuery(string query, string key, string newvalue)
        {
            Regex reg = new Regex("(?<=" + key + "=).*?(?=&|$)", RegexOptions.IgnoreCase);
            return reg.Replace(query, newvalue);
        }

把正则换上楼上的试试

收获园豆:20
happydaily | 菜鸟二级 |园豆:260 | 2012-10-31 17:37

再请教一下,如何把被替换之前的提取出来呢?

假扮天使 | 园豆:30 (初学一级) | 2012-11-01 09:45
其他回答(1)
0

提取A的正则:<a[^<]+>|</a>

田林九村 | 园豆:2367 (老鸟四级) | 2012-10-31 17:27

之后呢?

支持(0) 反对(0) 假扮天使 | 园豆:30 (初学一级) | 2012-10-31 17:29
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册