首页 新闻 搜索 专区 学院

请问高手,如何过滤掉网页中缀余信息

0
悬赏园豆:50 [已关闭问题] 关闭于 2008-07-09 15:42
<P><STRONG><FONT color=#000080 size=3>&nbsp;请帮忙看下面的截图,我现在想通过一种算法,实现去除其中的广告</FONT></STRONG></P> <P><STRONG><FONT color=#000080 size=3>等一些缀余信息,还过滤掉那些不重要的东西。我只要提取正文标题</FONT></STRONG></P> <P><STRONG><FONT color=#000080 size=3>&nbsp;</FONT></STRONG><STRONG><FONT color=#000080 size=3>和内容,提取后下载到本地,而不用去浏览网页,这样能实现吗?</FONT></STRONG></P> <P><STRONG><FONT color=#000080 size=3>请高手指教下,谢谢啦!</FONT></STRONG></P> <P><IMG title=过滤冗余信息 height=768 alt=新浪的一个截图 src="http://hiphotos.baidu.com/highadmin/pic/item/cfe8fe1b0781e20f8718bf86.jpg" width=1024 mce_src="http://hiphotos.baidu.com/highadmin/pic/item/cfe8fe1b0781e20f8718bf86.jpg"></P> <P><STRONG><FONT color=#000080 size=3></FONT></STRONG>&nbsp;</P> <P>&nbsp;</P>
刘皇叔的主页 刘皇叔 | 初学一级 | 园豆:120
提问于:2008-07-08 17:02
< >
分享
所有回答(2)
0
可以用正则表达式取出你想要的内容。
Windie Chai | 园豆:580 (小虾三级) | 2008-07-08 17:23
0
没错,用正则表达式
玉开 | 园豆:8822 (大侠五级) | 2008-07-08 18:06
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册