PDF体检报告,根据不同的检查项,来解析获取检查项的结果值,检查项顺序有可能杂乱,字段截取可能会出现相同字段,求各位大佬相助。。。如何解决,求方案
你这个问题,是要做字符串解析,你应该去查下正则,json或者string之类的解析方法
看能不能转成word,然后在用一些word读取库来提取。如果pdf内容是一张图片,那费点劲,需要图像识别
Word不是存在表格信息和文本信息吗?
直接读取pdf数据的dll有,百度一下,像 spire.pdf,itextsharp,等
读取文本信息容易 就是从信息里面获取结果值