<tbody> <tr> <td>1</td> <td> <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350206810000135</a> </td> <td> <a href="javascript:ssztView('2c97f194148b489901148b66ce2c04c7','14','厦门市湖里区路斯服饰店','2','1','350206810000135')">厦门市湖里区路斯服饰店</a> </td> <td>注销</td> <td>商事登记簿</td> </tr> <tr> <td>2</td> <td> <a href="javascript:ssztView('2c97f19049eba4fd0149f4673552211e','06','厦门欧贸易有限公司','2','1','350203200507411')">350212820025387</a> </td> <td> <a href="javascript:ssztView('2c97f1941d471088011d47cd190805e4','14','厦门市同安区欣办公设备经营部','2','1','350212820025387')">厦门市同安区欣办公设备经营部</a> </td> <td>存在</td> <td>商事登记簿</td> </tr> </tbody>
需求:获取html代码中加粗下划线的内容,最终得到如下表格的数据
<[^>]*>[^>]*(.*)[^>)]*<\\/[^>]*[>]获取页面的标签的正则,可能有点问题,自己调一下
何必这样写啊,把你需要的字符串放在一个属性里面,然后用js找到a标签,找到存放数据的属性,用split秒秒解析好
强烈建议楼主使用HtmlAgilityPack库进行HTML解析,简单易用方便快捷!
看起来可以用js遍历找到td下a标签href属性值再用字符串截取之后再,分割
对的 用HtmlAgilityPack库 解析 HTML 文档
用XPath
1、/tbody/tr 找到两个tr
2、类似的 对于每个tr 运用XPath 语法找到每个你想要的数据
匹配: <tr>[^<]*<td>\d+</td>[^<]*<td>.*?</td>[^<]*<td>[^<]*<a[^<]*href="javascript:ssztView\('(.*?)','(.*?)','(.*?)','(.*?)','(.*?)','(.*?)'\)"[^<]*>(.*?)</a>[^<]*</td>[^<]*<td>(.*?)</td>[^<]*<td>(.*?)</td>[^<]*</tr> 替换: <tr><td>$1</td><td>$2</td><td>$3</td><td>$4</td><td>$5</td><td>$6</td><td>$7</td><td>$8</td><td>$9</td></tr>
使用条件是你的table格式要固定。
这个表达式可以用,正好可以满足你的需求
('[0-9a-z]+','\d{2}','[^\x00-\xff]+','\d','\d','\d+')\)">[^\x00-\xff]+
正则表达式匹配到的group[1]就是你所需的值