首页 新闻 会员 周边

怎么才能快速的从html中找出url?

0
悬赏园豆:10 [已关闭问题]
我在摸索着做一个搜索引擎,需要快速从html中找出url,<BR>但是我现在的正则表达式只能达到30k/s的分析速度,<BR>我希望找到分析速度1m/s以上的方法。
问题补充: 我找到原因了,那个正则表达式没有lazy匹配,但是我一直没有找到解析url的表达式, 谁能给我一个,网上的很多都有问题。
sumer的主页 sumer | 初学一级 | 园豆:195
提问于:2008-08-05 22:26
< >
分享
其他回答(2)
0
这个应该很困难 但是有其他提高效率的办法 你可以用多线程 一次启动多个抓取
小眼睛老鼠 | 园豆:2731 (老鸟四级) | 2008-08-06 04:36
0
用正则表达式应该可以的吧?
金鱼 | 园豆:1090 (小虾三级) | 2008-08-06 11:07
0
在算法已经最优的前提下。提升硬件性是达到1m/s的唯一方法。
使名扬 | 园豆:230 (菜鸟二级) | 2008-08-07 00:12
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册