用正则表达式提取网页信息

悬赏园豆：10 [待解决问题]

<a href="http://www.microsoft.com/library/toolbar/3.0/trademarks/zh-cn.mspx">商标</a> |

<a href="http://www.microsoft.com/info/cn/privacy.mspx">隐私权声明</a>

|

<a href="http://go.microsoft.com/?linkid=8786242&lcid=2052">个人信息中心</a> |

<a href="http://www.microsoft.com/legal/">法律信息</a> |

<a href="http://www.microsoft.com/china/msdn/newsletter/default.aspx">MSDN Flash 中心</a> |

我想提取住每个<a href=*</a>之间的文字，用正则表达式提取，求大神帮帮我，我想过用字符串截取，但这个方法效率太低而且很繁琐。求大神指教！

正则表达式 C# .NET技术

烟霞 | 初学一级 | 园豆：166
提问于：2012-06-13 14:12

< >

所有回答(2)

'<\s*a\s.*?href\s*=\s*([\"\'])?(?(1)(.*?)\\1|([^\s\>]+))[^>]*>?(.*?)</a>'

無限遐想 | 园豆：3740 (老鸟四级) | 2012-06-13 14:26

<a\s+.*?href=".*?".*?>(.*?)</a>

artwl | 园豆：16736 (专家六级) | 2012-06-13 14:44

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。