<tr data-period="19001">
<td>19001</td>
<td class="bd"></td>
<td class="ball_brown" data-award="1" data-omit="-1">06</td>
<td class="f_red" data-award="1" data-omit="11">11</td>
<td class="ball_red" data-award="1" data-omit="0">18</td>
<td class="f_red" data-award="1" data-omit="1">1</td>
<td class="ball_red" data-award="1" data-omit="0">23</td>
<td class="f_red" data-award="1" data-omit="7">7</td>
<td class="ball_red" data-award="1" data-omit="0">26</td>
<td class="f_red" data-award="1" data-omit="20">20</td>
<td class="ball_red" data-award="1" data-omit="0">28</td>
<td class="f_red" data-award="1" data-omit="4">4</td>
<td class="ball_blue" data-award="1" data-omit="0">03</td>
<td class="f_blue" data-award="1" data-omit="14">14</td>
<td class="ball_blue" data-award="1" data-omit="0">12</td>
</tr>
我想要 19001 06 18 23 26 28 03 12
匹配三次,每一次输出作为后续输入
<td(>|\sclass=\"ball).*?/td>
>\d+<
\d+
纯用正则表达式貌似比较麻烦。
可以结合你使用的编程语言,先找到><之间的数字然后按照位置输出。
一定要用正则吗?可以直接用id获取相应<td>中的值 $("#test").html(),然后根据你的需要组成相应的数据。
建议学习下python的bs4包,获取这些元素很方便
...
– 老鼠蟒蛇 5年前