我想提取这个页面ul里面的内容http://gubaf10.eastmoney.com/search2.aspx?search_content=shang
需要获取的内容:<ul><li class="l1">827</li><li class="l2">2</li><li class="l3"><a href='look,600626,2007784681.html' >600626=.s yi bo zu li shi dong fang zhen juan</a> [<a href='topic,600626.html' class="q_t">申达股份吧</a>]</li><li class="l4">220.188.83.*</li><li class="l5">07-04 12:56</li><li class="l6">07-03</li></ul>
自己写的匹配表达式:<ul><li\sclass=l1>(?<click>[\s\S]*)</li><li\sclass=l2>(?<answer>[\s\S]*)</li><li\sclass=l3><a\shref=(?<code1>[\s\S]*)\s>(?<title>[\s\S]*)</a>\s\[<a\shref=(?<code>[\s\S]*)\sclass=q_t>(?<topicbar>[\s\S]*)</a>\]</li><li\sclass=l4>(?<author>[\s\S]*)</li><li\sclass=l5>(?<lastupdate>[\s\S]*)</li><li\sclass=l6>(?<time>[\s\S]*)</li></ul>
发现 当我只抽取页面一个ul标签的时候可以匹配,但是在整个页面匹配的时候他只能匹配到一个结果而不是一个结果集,请大家指教!!
^<ul><li\sclass=l1>.*<li\sclass=l2>.*<li\sclass=l3>.*<li\sclass=l4>.*<li\sclass=l5>.*<li\sclass=l6>.*</ul>$
试试这个
用你这个还是一样的只能匹配到一个结果
@多了特: 你说的结果集是什么,能贴一下代码不?
@多了特:
<script type="text/javascript">
var str="1 plus 2 equal 3"
document.write(str.match(/\d+/g)
)
</script>
输出:
1,2,3
匹配多个需要加g,有多个则返回一个数组,否则为null
(?<=<div class="h[34]">).*?(?=</div>)
学习学习,正则表达式,弱啊~