首页 新闻 赞助 找找看

用iTextSharp读取PDF文档中文本内容

1
悬赏园豆:20 [已关闭问题] 关闭于 2011-11-12 01:14
用iTextSharp读取PDF文档中文本内容,执行这条PdfReader p = new PdfReader(fn);语句时,提示PDF header signature not found
meifage2的主页 meifage2 | 初学一级 | 园豆:41
提问于:2011-10-26 11:10
< >
分享
所有回答(3)
0

dll发上来看看

graymaster | 园豆:7 (初学一级) | 2011-10-26 11:17

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.IO;using System.Text;
using System.Windows.Forms;
using iTextSharp;
using iTextSharp.text;
using iTextSharp.text.pdf;
using iTextSharp.text.xml;

支持(0) 反对(0) meifage2 | 园豆:41 (初学一级) | 2011-10-26 11:19
0

你调试一下看fn是不是正确的。

LCM | 园豆:6876 (大侠五级) | 2011-10-26 11:33

private void button1_Click(object sender, EventArgs e)
        {

            string pdfStr = readPDF(@"C:\WS994482.pdf");
            System.IO.File.WriteAllText(@"C:\FromPdf.txt", pdfStr);
        }
        private string readPDF(string fn)
        {
            PdfReader p = new PdfReader(fn);

支持(0) 反对(0) meifage2 | 园豆:41 (初学一级) | 2011-10-26 11:39
0

这个问题的原因有两个,一个是PDF本身文件有问题,比如损坏了,另外就是程序写的问题

我也出现了这个问题,因为我的参数是MemoryStream,在创建PdfReader 的时候忘了将Positon设置成0,这样就没有读取到任何数据,更别说读取header 了

滋生代码 | 园豆:202 (菜鸟二级) | 2013-03-04 11:16
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册