如何获取网页中所有的超链接地址以及链接innerText

悬赏园豆：40 [已关闭问题]

如题用多线程后台处理

我的处理方式:用webbrowser控件用一个全局变量，在线程方法里用while(变量==null )来查询，在webbrowser的documentcomplete事件中给变量赋值.然后通过 webbrowser.document.links来获取

.NET技术 C#

Object.prototype | 初学一级 | 园豆：155
提问于：2010-08-03 17:49

< >

其他回答(3)

用正则表达式搜索

Launcher | 园豆：45050 (高人七级) | 2010-08-03 17:54

http://www.cnblogs.com/cyq1162/archive/2010/02/04/1663521.html

我看这篇文章，文章后面有一个我写的浏览器工具源码下载，里面有代码获取当前页面所有链接并转成IP访问的。

获取所有链接那小块就适合你的问题了。

路过秋天 | 园豆：4794 (老鸟四级) | 2010-08-03 19:28

用JQuery 最快：

function findLinkText () {
            var arr = $("a");
            if (arr) {
                for (var i = 0; i < arr.length; i++) {
                    alert(arr[i].innerText);
                }
            }

可以在这里下载 jQuery.1.4.2.js http://jquery.com/

HUHU慈悲 | 园豆：9973 (大侠五级) | 2010-08-03 19:34

C#用正则式来找：
            string s = "xxx<a href=\"http://www.sina.com\">sina</a>yyy<a target=\"_blank\" href=\"http://www.sohu.com\" x=\"x\">sohu</a>";
            string p = "<a\\s?[^>]*?\\s?href=\"([^\"]+)\"[^>]*>([^<]+)</a>";
            var collection = Regex.Matches(s, p);
            if (collection.Count > 0)
            {
                foreach (Match it in collection)
                {
                    Label1.Text += "<br />" + it.Groups[1].Value + "===" + it.Groups[2].Value;
                }
            }

灰灰狼 | 园豆：5 (初学一级) | 2010-08-04 15:58

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

如何获取网页中所有的超链接地址 以及链接innerText

如何获取网页中所有的超链接地址以及链接innerText