现写了一个,测试通过,保证有用
var text = "<a class='link' href='www.baidu.com' target='_blank'>百度</a>"; var groups = Regex.Match(text, @"<a.*? href=['""]([^'""]+)['""][^>]*>([^<]+)</a>").Groups; Console.WriteLine(groups[1].Value); Console.WriteLine(groups[2].Value);
看着正则,我就头大,晦涩难懂。请问有啥好的方式学这玩意?我每次要用就去百度下或者查看自己搜集的部分正则。
@幻天芒: 我当时是通过阅读《精通正则表达式》学习的
这个确实可以,哈哈,如果我只是取href中有特定字符串的该怎么写,比如我只想要href中包括"file"字符的。
建议使用NSoup。
没有用过这个插件,百度了下也没有找到合适的解决方法,烦请给出样例
@lllhhu:
var doc = new NSoup.Nodes.Element(NSoup.Parse.Tag.ValueOf("Root"), String.Empty); doc.Append("<a href='www.baidu.com'>百度</a>"); var element = doc.Children.First; Console.WriteLine(element.Attr("href")); Console.WriteLine(element.Text()); Console.ReadKey();
除了正则,还可以将字符串,用xml的方式加载,然后获取属性等~