正则表达式：获取html中指定标签内容

悬赏园豆：30 [待解决问题]

<tbody>
    <tr>
        <td>1</td>
        <td>
            <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350206810000135</a>
        </td>
        <td>
            <a href="javascript:ssztView('2c97f194148b489901148b66ce2c04c7','14','厦门市湖里区路斯服饰店','2','1','350206810000135')">厦门市湖里区路斯服饰店</a>
        </td>
        <td>注销</td>
        <td>商事登记簿</td>
    </tr>
    <tr>
        <td>2</td>
        <td>
            <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350212820025387</a>
        </td>
        <td>
            <a href="javascript:ssztView('2c97f1941d471088011d47cd190805e4','14','厦门市同安区欣办公设备经营部','2','1','350212820025387')">厦门市同安区欣办公设备经营部</a>
        </td>
        <td>存在</td>
        <td>商事登记簿</td>
    </tr>
</tbody>

需求：获取html代码中加粗下划线的内容，最终得到如下表格的数据

C# 正则表达式 html

Yurbin | 初学一级 | 园豆：76
提问于：2015-08-13 01:52

< >

所有回答(7)

<[^>]*>[^>]*(.*)[^>)]*<\\/[^>]*[>]获取页面的标签的正则，可能有点问题，自己调一下

稳稳的河 | 园豆：4216 (老鸟四级) | 2015-08-13 09:22

-1

何必这样写啊，把你需要的字符串放在一个属性里面，然后用js找到a标签，找到存放数据的属性，用split秒秒解析好

powerixao | 园豆：401 (菜鸟二级) | 2015-08-13 09:36

强烈建议楼主使用HtmlAgilityPack库进行HTML解析，简单易用方便快捷！

hippieZhou | 园豆：578 (小虾三级) | 2015-08-13 09:43

看起来可以用js遍历找到td下a标签href属性值再用字符串截取之后再，分割

wuyubing | 园豆：204 (菜鸟二级) | 2015-08-13 10:13

对的用HtmlAgilityPack库解析 HTML 文档

用XPath

1、/tbody/tr 找到两个tr

2、类似的对于每个tr 运用XPath 语法找到每个你想要的数据

clarlespeng | 园豆：469 (菜鸟二级) | 2015-08-13 13:21

匹配：
<tr>[^<]*<td>\d+</td>[^<]*<td>.*?</td>[^<]*<td>[^<]*<a[^<]*href="javascript:ssztView\('(.*?)','(.*?)','(.*?)','(.*?)','(.*?)','(.*?)'\)"[^<]*>(.*?)</a>[^<]*</td>[^<]*<td>(.*?)</td>[^<]*<td>(.*?)</td>[^<]*</tr>



替换：
<tr><td>$1</td><td>$2</td><td>$3</td><td>$4</td><td>$5</td><td>$6</td><td>$7</td><td>$8</td><td>$9</td></tr>

使用条件是你的table格式要固定。

Yu | 园豆：12990 (专家六级) | 2015-08-14 08:45

这个表达式可以用，正好可以满足你的需求

('[0-9a-z]+','\d{2}','[^\x00-\xff]+','\d','\d','\d+')\)">[^\x00-\xff]+

正则表达式匹配到的group[1]就是你所需的值

瑾 | 园豆：332 (菜鸟二级) | 2015-09-01 10:14

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。