首页 新闻 会员 周边

正则表达式:获取html中指定标签内容

0
悬赏园豆:30 [待解决问题]
<tbody>
    <tr>
        <td>1</td>
        <td>
            <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350206810000135</a>
        </td>
        <td>
            <a href="javascript:ssztView('2c97f194148b489901148b66ce2c04c7','14','厦门市湖里区路斯服饰店','2','1','350206810000135')">厦门市湖里区路斯服饰店</a>
        </td>
        <td>注销</td>
        <td>商事登记簿</td>
    </tr>
    <tr>
        <td>2</td>
        <td>
            <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350212820025387</a>
        </td>
        <td>
            <a href="javascript:ssztView('2c97f1941d471088011d47cd190805e4','14','厦门市同安区欣办公设备经营部','2','1','350212820025387')">厦门市同安区欣办公设备经营部</a>
        </td>
        <td>存在</td>
        <td>商事登记簿</td>
    </tr>
</tbody>

 需求:获取html代码中加粗下划线的内容,最终得到如下表格的数据

Yurbin的主页 Yurbin | 初学一级 | 园豆:76
提问于:2015-08-13 01:52
< >
分享
所有回答(7)
0

<[^>]*>[^>]*(.*)[^>)]*<\\/[^>]*[>]获取页面的标签的正则,可能有点问题,自己调一下

稳稳的河 | 园豆:4216 (老鸟四级) | 2015-08-13 09:22
-1

何必这样写啊,把你需要的字符串放在一个属性里面,然后用js找到a标签,找到存放数据的属性,用split秒秒解析好

powerixao | 园豆:401 (菜鸟二级) | 2015-08-13 09:36
0

强烈建议楼主使用HtmlAgilityPack库进行HTML解析,简单易用方便快捷!

hippieZhou | 园豆:578 (小虾三级) | 2015-08-13 09:43
0

看起来可以用js遍历找到td下a标签href属性值再用字符串截取之后再,分割

wuyubing | 园豆:204 (菜鸟二级) | 2015-08-13 10:13
0

对的 用HtmlAgilityPack库  解析 HTML 文档

用XPath 

1、/tbody/tr  找到两个tr

2、类似的 对于每个tr 运用XPath 语法找到每个你想要的数据 

clarlespeng | 园豆:469 (菜鸟二级) | 2015-08-13 13:21
0
匹配:
<tr>[^<]*<td>\d+</td>[^<]*<td>.*?</td>[^<]*<td>[^<]*<a[^<]*href="javascript:ssztView\('(.*?)','(.*?)','(.*?)','(.*?)','(.*?)','(.*?)'\)"[^<]*>(.*?)</a>[^<]*</td>[^<]*<td>(.*?)</td>[^<]*<td>(.*?)</td>[^<]*</tr>



替换:
<tr><td>$1</td><td>$2</td><td>$3</td><td>$4</td><td>$5</td><td>$6</td><td>$7</td><td>$8</td><td>$9</td></tr>

使用条件是你的table格式要固定。

Yu | 园豆:12980 (专家六级) | 2015-08-14 08:45
0

这个表达式可以用,正好可以满足你的需求

('[0-9a-z]+','\d{2}','[^\x00-\xff]+','\d','\d','\d+')\)">[^\x00-\xff]+

正则表达式匹配到的group[1]就是你所需的值

| 园豆:332 (菜鸟二级) | 2015-09-01 10:14
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册