首页 新闻 搜索 专区 学院

c#正则表达式提取字符

0
[待解决问题]

目的是将<a>标签内的字符提取出来,例如

<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国' target='_blank'>中国</a>:<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河南省' target='_blank'>河南省</a>;<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省' target='_blank'>河北省</a>(<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=石家庄市' target='_blank'>石家庄市</a>|<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=石家庄市&Place=藁城区' target='_blank'>藁城区</a>,<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=唐山市' target='_blank'>唐山市</a>|<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=唐山市&Place=路南区' target='_blank'>路南区</a>-<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=唐山市&Place=路北区' target='_blank'>路北区</a>,<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=河北省&City=张家口市' target='_blank'>张家口市</a>);<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=湖北省' target='_blank'>湖北省</a>(<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=湖北省&City=武汉市' target='_blank'>武汉市</a>);<a href='http:///user/Album.aspx?Region=中国&Province=湖南省' target='_blank'>湖南省</a>(<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=中国&Province=湖南省&City=长沙市-芙蓉区' target='_blank'>长沙市-芙蓉区</a>)。<a href='http://xxx.xxx.xxx.xxx/user/Album.aspx?Region=日本' target='_blank'>日本</a>。

提取结果为
中国:河南省;河北省(石家庄市|藁城区,唐山市|路南区-路北区,张家口市);湖北省(武汉市);湖南省(长沙市-芙蓉区)。日本。

不用正则表达式也可以,如何实现呢?

寻找薛定谔的猫的主页 寻找薛定谔的猫 | 初学一级 | 园豆:61
提问于:2022-03-01 16:56
< >
分享
所有回答(2)
0

最简单的就是正则

22222220 | 园豆:8 (初学一级) | 2022-03-02 10:37

嗯,就是不会才问的。
请教代码应该怎么写?

支持(0) 反对(0) 寻找薛定谔的猫 | 园豆:61 (初学一级) | 2022-03-02 13:59
0

彭小立 | 园豆:594 (小虾三级) | 2022-03-02 16:53

谢谢老师。
提取的结果是
中国:河南省;河北省(石家庄市|藁城区,唐山市|路南区-路北区,张家口市)湖北省(武汉市)湖南省(长沙市|芙蓉区)日本。
有两个问题:
1,日本前面(不同的国家直接)应该有个句号
2,提取完的字符中出现了空格(只能提取后通过Replace处理吗?)

请问能解决吗?

支持(0) 反对(0) 寻找薛定谔的猫 | 园豆:61 (初学一级) | 2022-03-03 09:56

@寻找薛定谔的猫: 可以的啊 我去瞅瞅
1.不同国家之间的句号应该是还在的 好像被我不小心删了
2.内容的空格Trim一下就行

支持(0) 反对(0) 彭小立 | 园豆:594 (小虾三级) | 2022-03-03 10:11

@彭小立: 求教把句号也提取出来的正则,谢谢老师

支持(0) 反对(0) 寻找薛定谔的猫 | 园豆:61 (初学一级) | 2022-03-03 13:55

@寻找薛定谔的猫: 就上面这个图的就行

支持(0) 反对(0) 彭小立 | 园豆:594 (小虾三级) | 2022-03-03 13:57

@彭小立: 万分感谢老师!!!

支持(0) 反对(0) 寻找薛定谔的猫 | 园豆:61 (初学一级) | 2022-03-03 15:45

@彭小立: 好心人

支持(0) 反对(0) 会长 | 园豆:11690 (专家六级) | 2022-03-04 11:36
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册