赞
踩
使用python读取pdf文件的内容
读取第1页的内容:
- import PyPDF2
- pdfFileObj = open('a.pdf', 'rb')
- pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
- print(pdfReader.numPages)
-
- pageObj = pdfReader.getPage(0)
- print(pageObj.extractText())
输出该pdf文件共有多少页,并输出该pdf的第1页的内容。
读取第1-100页的内容:
- import PyPDF2
- pdfFileObj = open('a.pdf', 'rb')
- pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
- print(pdfReader.numPages)
-
- for i in range(100):
- pageObj = pdfReader.getPage(i)
- print(pageObj.extractText())
输出该pdf文件共有多少页,并输出该pdf的第1-100页的内容。
注意:将a.pdf与python文件放在同一目录下。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。