当前位置:   article > 正文

python读取pdf文件

python读取pdf

使用python读取pdf文件的内容

读取第1页的内容:

  1. import PyPDF2
  2. pdfFileObj = open('a.pdf', 'rb')
  3. pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
  4. print(pdfReader.numPages)
  5. pageObj = pdfReader.getPage(0)
  6. print(pageObj.extractText())

输出该pdf文件共有多少页,并输出该pdf的第1页的内容。

读取第1-100页的内容:

  1. import PyPDF2
  2. pdfFileObj = open('a.pdf', 'rb')
  3. pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
  4. print(pdfReader.numPages)
  5. for i in range(100):
  6. pageObj = pdfReader.getPage(i)
  7. print(pageObj.extractText())

输出该pdf文件共有多少页,并输出该pdf的第1-100页的内容。

注意:将a.pdf与python文件放在同一目录下。

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/article/detail/51537
推荐阅读
相关标签
  

闽ICP备14008679号