可以将PDF文件直接转换为文本文件,非常简单好用,它对中文PDF文档的处理能力超过Adobe的Acrobat,OCR版已经支持Embed Font的抽取,对于图像PDF也能抽取其中的文本。
1.完全支持PDF1.4协议(Acrobat 5.0支持)2.支持日文(SHIFT-JIS、EUC等编码)文本的抽取3.支持BIG5文本的抽取4.完全基于Unicode内核,支持字符集更多更广5.任何工具软件生成的PDF文档均可解析,对PDF的内部错误数据流可以自动纠正。6.支持TrueType、Type0、Type1等字体编码的处理7.标准的Windows界面,操作更为便捷8.生成的TXT文档可保留原版面的格式布局9.支持批量处理10.OCR插件支持OCR中文识别,可抽取任何PDF中的中文字符11.可直接解析指定页的PDF数据,与页面顺序无关。12.界面友好,在转换时既支持单个文件的转换,也支持批量文件同时转换,可以设置转换页的范围,可以只转任何一页,也可以转换任意范围之内的所有页。 |