首页 新闻 搜索 专区 学院

如何用正则取多行文字 ,如下所示

0
悬赏园豆:20 [待解决问题]

在下面文字 中,取行首和行末的div中间的table

<div class="content"> <table width="80%">
<tbody>
<tr>
<td>
<br>
<img border="0" src="http://img13.poco.cn/mypoco/myphoto/20120623/14/56643687201206231458382839331784365_000.jpg"><br>
<br>
<br>
◎译  名 超人VS十字军团/超人大战猎杀团<br>
◎片  名 Superman vs the Elite<br>
◎年  代 2012<br>
◎国  家 美国<br>
◎类  别 动画<br>
◎语  言 英语<br>
◎字  幕 中英双字<br>
◎IMDB评分 7.2/10 from 422 users<br>
◎IMDB链接 http://www.imdb.com/title/tt2224455<br>
◎文件格式 高清蓝光720P版BD-RMVB<br>
◎视频尺寸 1280 x 720<br>
◎文件大小 1CD 801MB<br>
◎片  长 74 Mins<br>
◎导  演 Michael Chang<br>
◎主  演 宝蕾·佩雷特 Pauley Perrette ....Lois Lane (voice)<br>
      乔治·纽伯恩 George Newbern ....Superman (voice)<br>
      Robin Atkin Downes ....Manchester Black (voice)<br>
      David Kaufman ....Jimmy Olsen (voice)<br>
      Julie Wittner ....Cowering Woman (voice)<br>
      Steve Blum ... (voice)<br>
      Catero Colbert ... Coldcast (voice)<br>
      Melissa Disney ... Menagerie (voice)<br>
      Crispin Freeman ... (voice)<br>
      Andrew Kishino ...The Hat (voice)<br>
      Tara Strong ... Young Vera (voice)<br>
      <br>
<br>
◎简  介 <br>
<br>
世界局势愈发动荡,超能力罪犯们不断的越狱,比亚利亚和珀戈利斯坦边境战事升级,恐怖袭击在世界各地时有发生,独裁者以恐惧压迫人民,每个人都感受到生命的威胁。 我们所熟悉的超人依然为了世界和平而做着自己的努力,一次次的击败超能罪犯,一次次化解战争争端,这一次,一队化名极英盟的"超级英雄"站出来帮助他,解救困在海底的列车,击败原子骷髅,全世界人民都为了他们的新英雄而欢呼,仿佛超人被替代了,而超人的感觉告诉他,事情远没有这么简单,极英盟的目的到底是什么,马上揭晓。<br>
<br>
<br>
<br>
◎影片截图<br>
<br>
<img border="0" src="http://img170.poco.cn/mypoco/myphoto/20120625/14/56643687201206251406174238583849362_000.jpg"><br>
<br>
<img border="0" src="http://img170.poco.cn/mypoco/myphoto/20120625/14/56643687201206251406174238583849362_001.jpg"><br>
<br>
<img border="0" src="http://img170.poco.cn/mypoco/myphoto/20120625/14/56643687201206251406174238583849362_003.jpg"><br>
<br>
<img border="0" src="http://img170.poco.cn/mypoco/myphoto/20120625/14/56643687201206251406174238583849362_002.jpg"><br>
<br>
<br>
<br>
<img border="0" src="http://img04.taobaocdn.com/imgextra/i4/229823360/T2NldIXghXXXXXXXXX_!!229823360.jpg"><br>
<br>
<a href="http://v.dyshoufa.com/t.php/FC1340604648.html" target="_blank">【<b>点此进入--BT下载地址1</b>】</a><br>
<br>
<br>
<a href="http://h.dyshoufa.com/t.php/OI1340604643.html" target="_blank">【<b>点此进入--BT下载地址2</b>】</a><br>
<br>
<br>
<br>
<img border="0" src="http://img04.taobaocdn.com/imgextra/i4/229823360/T2NldIXghXXXXXXXXX_!!229823360.jpg"><br>
<br>
<br>
<a href="http://w.xzshoufa.com/t.php/LE1340604656.html" target="_blank">【<b>点此进入--迅雷下载地址</b>】</a></td>
</tr>
</tbody>
</table>
<p>
&nbsp;</p>
</div>

水木的主页 水木 | 初学一级 | 园豆:12
提问于:2012-06-25 22:33
< >
分享
所有回答(3)
0

回车、换行、tab、空格都属于空白字符,可以使用通用的空白字符来检索。此外,他们在正则表达式中都有自己的专属定义。

<div class="content">\s*(<table[\s|\S]*</table>)<p>\s*&nbsp;\s*</p>\s*</div>

 

正则表达式_百度百科

无之无 | 园豆:5085 (大侠五级) | 2012-06-25 22:39

不行呀,还有换行呢。还是出不来

支持(0) 反对(0) 水木 | 园豆:12 (初学一级) | 2012-06-25 22:54

@水木: 你参考下我提供给你的连接吧。

\s表示所有空白字符,包括空格、换行、回车、tab等等。

支持(0) 反对(0) 无之无 | 园豆:5085 (大侠五级) | 2012-06-25 22:55
0

试试RegexOptions.Multiline

DeeRoad | 园豆:3 (初学一级) | 2012-06-26 10:09
0

匹配包含换行在内的所有字符,一般用(\w|\W)*,C#实现代码如下(已通过测试):

Console.WriteLine(Regex.Match(text, 
    @"<div class=""content"">\s*(<table[^>]*>(\w|\W)*?</table>)", 
    RegexOptions.IgnoreCase)
    .Groups[1].Value);
dudu | 园豆:38831 (高人七级) | 2012-06-26 10:26
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册