如题所说.
最近做的一个项目里面有个采集模块,我决定采用HtmlParser来实现该模块.
看了看园子里的例子,感觉不难,于是就开始写了,然后就发现了问题.
比如:
1 Parser parser = Parser.CreateParser(html,"utf-8");
2 NodeFilter divFilter = new NodeClassFilter(typeof(Div));
3 //第一次执行解析,这时还是能解析到东西的.
4 NodeList list1 = parser.parser(divFilter );
5 //第二次解析
6 NodeFilter aFilter = new NodeClassFilter(typeof(ATag));
7 //这时就会什么都解析不到了.如果parser.Reset();这样之后就可以继续解析了
8 NodeList list2 = parser.parser(aFilter);
9
这样很是郁闷啊,不知道哪位大大用过的可以帮帮忙~
小弟在这谢过了~
parser.reset();