先上代码:
HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument(); document.LoadHtml(html);
加载一段HTML代码后用document.DocumentNode.SelectNodes("//html//")获取一个form表单,死活就是获取不到。。。
document.DocumentNode.SelectNodes("//html[1]//body[1]//div[@class='btn']")[0].InnerHtml
上面的代码获取到的HTML是这样的:
<form id="bdinfo" name="bdinfo" method="post" target="_blank"> <input type="hidden" name="recNo" value="201311291740454758"> <input type="hidden" name="pdfurl" value=""> <input type="hidden" name="htmlurl" value=""> <input type="button" name="pdf" class="oc_button_pdf" value='查看PDF格式' onclick="select('pdf')"> <input type="button" name="print" class="oc_button_print" value='查看HTML格式' onclick="select('html')"> </form>
我用
document.DocumentNode.SelectNodes("//html[1]//body[1]//div[@class='btn']//form[1]")[0].InnerHtml
这样的代码获取可以获取到form元素,但是它的innerHTML属性值为"",怎么弄都不行。。document.GetElementbyid("bdinfo")直接获取表单ID也不行。。哪个高手给分析一下啊