首页 新闻 搜索 专区 学院

用正则表达式提取网页信息

0
悬赏园豆:10 [待解决问题]

<a href="/zh-cn/cc300389.aspx">保留所有权利</a><span class="pipe"> | </span>

    <a href="http://www.microsoft.com/library/toolbar/3.0/trademarks/zh-cn.mspx">商标</a><span class="pipe"> | </span>
    <a href="http://www.microsoft.com/info/cn/privacy.mspx">隐私权声明</a>
    <span class="pipe">| </span>
    <a href="http://go.microsoft.com/?linkid=8786242&amp;lcid=2052">个人信息中心</a><span class="pipe"> | </span>
    <a href="http://www.microsoft.com/legal/">法律信息</a><span class="pipe"> | </span>
    <a href="http://www.microsoft.com/china/msdn/newsletter/default.aspx">MSDN Flash 中心</a><span class="pipe"> | </span>
    <a href="mailto:msdnonln@microsoft.com">联系我们</a>
 
我想提取住每个<a href=*</a>之间的文字,用正则表达式提取,求大神帮帮我,我想过用字符串截取,但这个方法效率太低而且很繁琐。求大神指教!
烟霞的主页 烟霞 | 初学一级 | 园豆:166
提问于:2012-06-13 14:12
< >
分享
所有回答(2)
0

'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'

無限遐想 | 园豆:3740 (老鸟四级) | 2012-06-13 14:26
0
<a\s+.*?href=".*?".*?>(.*?)</a>
artwl | 园豆:16536 (专家六级) | 2012-06-13 14:44
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册