只需要读取其中文字内容即可,什么图片什么的都不必管!
最简单的方式!!!!
Office格式使用OpenXML,参考 http://www.cnblogs.com/2018/category/249767.html
PDF使用pdfboxhttp://sourceforge.net/projects/pdfbox/ 更多的信息参考 http://stackoverflow.com/search?q=c%23+read+pdf
NPOI,Itextsharp