在使用XmlDocument的LoadXml方法加载xml时,如是提示。意思是第一行第一个字符错误,因为xml要求文件开始必须是<xml这样,所以应该是这地方出了问题。Debug一下,发现了下面的两个问题。
1. 因为是通过web获取xml,所以编码问题导致了xml中出现乱码,我的解决办法是在获取时加入编码格式的设置,根据地址不同使用不同的encoding,具体实现跟使用的download方法有关。
2.在xml文件的开头有隐藏的非法字符,之所以说隐藏,是因为我在debug时快速监视看到的数据完全是正常的(即开始就是类似<xml...),但是取得第一个字符却不是<,而是个双引号。于是在获取到xml后又加了个replace的代码:
rssxml = System.Text.RegularExpressions.Regex.Replace(rssxml, "^[^<]", "");
意思是删除从字符串开始到<之间的所有字符。
解决了上面两个问题,再次运行,通过~