首页 新闻 会员 周边

如何获取网页中所有的超链接地址 以及链接innerText

0
悬赏园豆:40 [已关闭问题]

如题 用多线程后台处理

我的处理方式:用webbrowser控件 用一个全局变量,在线程方法里用while(变量==null )来查询,在webbrowser的documentcomplete事件中给变量赋值.然后通过 webbrowser.document.links来获取

 

Object.prototype的主页 Object.prototype | 初学一级 | 园豆:155
提问于:2010-08-03 17:49
< >
分享
其他回答(3)
0

用正则表达式搜索

Launcher | 园豆:45045 (高人七级) | 2010-08-03 17:54
0

http://www.cnblogs.com/cyq1162/archive/2010/02/04/1663521.html

我看这篇文章,文章后面有一个我写的浏览器工具源码下载,里面有代码获取当前页面所有链接并转成IP访问的。

获取所有链接那小块就适合你的问题了。

路过秋天 | 园豆:4787 (老鸟四级) | 2010-08-03 19:28
0

用JQuery 最快:

function findLinkText () {
            var arr = $("a");
            if (arr) {
                for (var i = 0; i < arr.length; i++) {
                    alert(arr[i].innerText);
                }
            }

可以在这里下载 jQuery.1.4.2.js   http://jquery.com/

HUHU慈悲 | 园豆:9973 (大侠五级) | 2010-08-03 19:34
0

C#用正则式来找:
            string s = "xxx<a href=\"http://www.sina.com\">sina</a>yyy<a target=\"_blank\" href=\"http://www.sohu.com\" x=\"x\">sohu</a>";
            string p = "<a\\s?[^>]*?\\s?href=\"([^\"]+)\"[^>]*>([^<]+)</a>";
            var collection = Regex.Matches(s, p);
            if (collection.Count > 0)
            {
                foreach (Match it in collection)
                {
                    Label1.Text += "<br />" + it.Groups[1].Value + "===" + it.Groups[2].Value;
                }
            }

灰灰狼 | 园豆:5 (初学一级) | 2010-08-04 15:58
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册