<a title="分类1" href="cate1.html" data-type="cate" /><a title="文章一" href="article1.html" data-type="article" /><a title="文章二" href="article2.html" data-type="article" /><a title="分类2" href="cate2.html" data-type="cate" /><a title="文章三" href="article3.html" data-type="article" />
如上,我怎么才能匹配所有文章而忽略分类呢?
<a title="(.+?)" href=".+?.html" data-type="article" />
用这个表达式 获取到名称有两个都是分类名. 如何让他从最近的开始匹配呢?
我想获取到的数据是:
文章一
文章二
文章三
<a title="[^"]+" href="[^"]+.html" data-type="article" />