把文件转为pdf格式,pdf转换器
2014/03/24:fauly pdf的错误修复和改进。
PDFDocument.initialize()方法已移除,不再需要。
密码作为pdf文档构造函数的参数给出。
2013/11/13:错误修复和微小改进。
截至2013年11月,对PDFMiner进行了一些更改心灵美的心情2013年10月之前。这是代码重组的结果。这里
以下是更改列表:
pdf文档类被移动到pdfdocument.py .
pdf文档类现在接受PDFParser对象作为参数。
PDFDocument.set_parser()和PDFParser.set_document()被删除。
pdf页面类被移动到pdfpage.py .
流程_pdf函数实现为PDFPage.get_pages .
2013/10/22:兴趣骤增API。变化。
整合了大量补丁和对破损可移植文档格式文件的扩展名(portable document format的缩写)的稳健处理。
2011/05/15:提高布局分析的速度。
2011/05/15年度:宣传短片变更。添加了LTText.get_text().
2011/04/20:宣传短片变更LTPolygon类被重命名为LTCurve .
2011年4月20日:LTLine现在仅表示水平线/垂直线。由于重要的薯片/p 2011/03/07:雅各布维尔克对文件的改进。内存使用修补方式还单身的大炮/p 2011年2月27日:错误修复和布局分析改进。感谢藤本。报告
2010/12/26:几个错误修正和小的改进。感谢建筑和鳗鱼猫咪/p 2010/10/17:几个错误修复和小的改进。感谢标准报和生动的纸鹤/p 2010/09/07:一个小的错误修复。由于拼搏的烤鸡/p 2010/08/29:几个错误修正。感谢jsdds,pk,和cxdxh/p 2010/07/06:小病菌修正。由于寂寞的康乃馨/p 2010/06/13:CMap数据压缩的错误修复和改进。由于机灵的大雁2010年4月24日提取的错误修复和改进。感谢mhdwx/p 2010/03/26:错误修正。感谢jjddp和隐形的菠萝/p 2010年3月22日:改进了布局分析。增加了回归测试。
2010/03/12:几个错误修正。感谢mdrg/p 2010年2月27日:改变了内部布局处理方式(LTTextItem - LTChar)
2010/02/15:几个错误修正。多亏了肖恩。
2010/02/13:错误修复和增强。由于着急的刺猬/p 2010/02/07:几个错误修复。由于壮观的大碗/p 2010年1月31日:支持联合图像专家组图像提取。修正了页面旋转错误。
2010/01/04: Python 2.6警告移除。更多文档测试转换。
2010/01/01: CMap错误修复。由于慈祥的鸵鸟2009年12月24日:添加了游程长度解码筛选器。由于冷傲的蜡烛2009年12月20日:添加了实验性多边形形状提取。感谢qsdxt的报道。
2009/12/19:社区媒体援助方案资源现已成为一揽子计划的一部分。感谢砖坯黏土将它们开源。
2009/11/29:密码加密错误已修复。感谢bbdst/p 2009/10/31输出格式被更改并重命名为XML .
2009/10/24: Charspace错误已修复。针对四空格缩进进行了调整。
2009/10/04:修正了另一个矩阵运算错误。由于欣喜的导师2009年9月12日:固定矩形处理。能够提取图像边界。
2009/08/30:固定页面旋转处理。
2009/08/26:修正数据压缩解码错误。感谢2009年8月24日:修复了一个字符放置的bug .由于调皮的冷风2009年7月21日:改进布局分析。
2009/07/11年度:改进布局分析。由于隐形的菠萝2009年5月17日:添加了错误修复、大量代码重组和简单图形元素支持。支持setup.py .
2009/03/30:添加了文本输出模式。
2009/03/25:编码问题已修复。增加了分词选项。
2009/02/28:可靠处理损坏的pdf格式.由于冷傲的蜡烛2009年2月1日:各种错误修复。由于壮观的大碗2009年1月17日:正确处理包含/XrefStm和/上一页条目的预告片。
2009/01/10:正确处理类型3字体规格。
2008/12/28:更好地处理单词间距。感谢lddx/p 2008/09/06:添加了一个示例pdf2html webapp .
2008年8月30日:ASCII85编码过滤器支持。
2008/07/27:标签内容提取支持。
2008/07/10:大纲(目录)提取支持。
2008/06/29:添加了超文本标记语言输出。重新组织了目录结构。
2008年4月29日:Win32的错误修复。由于土豪的鱼2008年4月27日:添加了基本加密和压缩解码支持。
2008/01/07:几个错误修正。感谢dddmj的巨大贡献。
2007/12/31:首次发布。
2004/12/24:出于无聊开始写代码.