首页新闻找找看学习计划

关键正则表达式提取数据的问题,

0
悬赏园豆:100 [已解决问题] 解决于 2013-07-20 21:02

<TABLE class="p122" height=25 cellSpacing=0 cellPadding=0 width="100%" border=0>
<TBODY>
<TR>
<TD align=middle width="9%"><IMG height=9 src="/Templets/TEMP_1/images/main_0006.jpg" width=9></TD>
<TD width="74%"><A href="/HtmlNews/kstz/sydwzpks/2013/7/13717172553130.html" target=_blank>2013年辽宁省人员公示</A></TD>
<TD width="17%"><FONT color=#999999>[13-07-17]</FONT></TD></TR></TBODY></TABLE>

 

正则表达式:(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>

只能提取上面链接中的链接与文字,怎样把 <font>[13-07-17]</font> 中的数据也提取出来呢?

(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a><FONT.*?>(?<T>.*?)</FONT>

这么写貌似不行啊。请指教啊

我为球狂的主页 我为球狂 | 初学一级 | 园豆:5
提问于:2013-07-19 15:55
< >
分享
最佳答案
0
<td[^>]*>(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a></td>[^>h]<td[^>]*><FONT[^>]*>(?<date>.*?)</FONT></td>

上面的是因为节点没匹配正确,再加上FONT错了。

修改下就OK了。

收获园豆:50
````` | 专家六级 |园豆:14268 | 2013-07-19 16:15

你好,你给我那个不行啊。提取不出来啊。请在帮我看看吧。 谢谢了

我为球狂 | 园豆:5 (初学一级) | 2013-07-19 16:33

@梁大业: 可以匹配的啊。正则属性上设置忽略大小写。

````` | 园豆:14268 (专家六级) | 2013-07-19 17:12
其他回答(2)
0

<a href="(?<url>[^>]+?)"[^>]+?>(?<text>[^<]+?)<[\s\S]+?<Font[^>]+?>(?<date>[^>]+?)<

收获园豆:20
只会造轮子 | 园豆:2448 (老鸟四级) | 2013-07-19 16:16

你好,你给我那个不行啊。提取不出来啊。请在帮我看看吧。 谢谢了

支持(0) 反对(0) 我为球狂 | 园豆:5 (初学一级) | 2013-07-19 16:33
0

(?is)<a[^>]*?href=(['""]?)(?<url>[^'""\s>]+)\1[^>]*>(?<text>(?:(?!</?a\b).)*)</a>|<FONT.*?>(?<T>.*?)</FONT>

收获园豆:30
Yu | 园豆:12944 (专家六级) | 2013-07-19 17:20

你好,你这方法管用,但是分两个组了貌似,能不能在一个里显示呢?

支持(0) 反对(0) 我为球狂 | 园豆:5 (初学一级) | 2013-07-19 18:55

@梁大业:

不能,只能通过程序操作匹配结果了

支持(0) 反对(0) Yu | 园豆:12944 (专家六级) | 2013-07-20 11:39
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册