首页 新闻 会员 周边 捐助

正则表达式匹配,求支援,,,

0
悬赏园豆:30 [待解决问题]

我想提取这个页面ul里面的内容http://gubaf10.eastmoney.com/search2.aspx?search_content=shang

 需要获取的内容:<ul><li class="l1">827</li><li class="l2">2</li><li class="l3"><a href='look,600626,2007784681.html' >600626=.s yi bo zu li shi dong fang zhen juan</a> [<a href='topic,600626.html' class="q_t">申达股份吧</a>]</li><li class="l4">220.188.83.*</li><li class="l5">07-04 12:56</li><li class="l6">07-03</li></ul>

 

自己写的匹配表达式:<ul><li\sclass=l1>(?<click>[\s\S]*)</li><li\sclass=l2>(?<answer>[\s\S]*)</li><li\sclass=l3><a\shref=(?<code1>[\s\S]*)\s>(?<title>[\s\S]*)</a>\s\[<a\shref=(?<code>[\s\S]*)\sclass=q_t>(?<topicbar>[\s\S]*)</a>\]</li><li\sclass=l4>(?<author>[\s\S]*)</li><li\sclass=l5>(?<lastupdate>[\s\S]*)</li><li\sclass=l6>(?<time>[\s\S]*)</li></ul>

发现 当我只抽取页面一个ul标签的时候可以匹配,但是在整个页面匹配的时候他只能匹配到一个结果而不是一个结果集,请大家指教!!

多了特的主页 多了特 | 初学一级 | 园豆:172
提问于:2012-08-22 15:05
< >
分享
所有回答(3)
0

^<ul><li\sclass=l1>.*<li\sclass=l2>.*<li\sclass=l3>.*<li\sclass=l4>.*<li\sclass=l5>.*<li\sclass=l6>.*</ul>$

试试这个

hardersen | 园豆:206 (菜鸟二级) | 2012-08-22 15:30

用你这个还是一样的只能匹配到一个结果

支持(0) 反对(0) 多了特 | 园豆:172 (初学一级) | 2012-08-22 15:51

@多了特: 你说的结果集是什么,能贴一下代码不?

支持(0) 反对(0) hardersen | 园豆:206 (菜鸟二级) | 2012-08-22 16:02

@多了特: 

<script type="text/javascript">

var str="1 plus 2 equal 3"
document.write(str.match(/\d+/g))

</script>

输出:

1,2,3

匹配多个需要加g,有多个则返回一个数组,否则为null
支持(0) 反对(0) hardersen | 园豆:206 (菜鸟二级) | 2012-08-22 16:12
0

(?<=<div class="h[34]">).*?(?=</div>)

张坤 | 园豆:1865 (小虾三级) | 2012-08-22 16:07
0

学习学习,正则表达式,弱啊~

Philomena | 园豆:154 (初学一级) | 2012-08-24 14:26
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册