Python全系列 教程
3567个小节阅读:5929.2k
目录
鸿蒙应用开发
C语言快速入门
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
xxxxxxxxxx
pip install pypdf2
pip install pdfplumber
函数名&属性&类 | 含义 |
---|---|
PyPDF2.PdfFileReader(file) | 读取PDF |
pdf.getNumPages() | 获取总页码 |
pdf.getPage(num) | 获取第num页数据 |
page.extractText() | 获取页面数据 |
xxxxxxxxxx
#pip install pypdf2
from PyPDF2 import PdfFileReader
def read_pdf1():
# 打开文件
with open('./base_data/10_word转换成pdf.pdf','rb') as f:
# 将打开的文件传递给Reader对象
reader = PdfFileReader(f)
# 获取页面的总页数
number = reader.getNumPages()
print(number)
# 获取单页
page = reader.getPage(0)
# 提取文本
info = page.extractText()
print(info)
# pip install pdfplumber
def read_pdf2():
import pdfplumber
# 打开文件
with pdfplumber.open('./base_data/10_word转换成pdf.pdf') as f:
# 获取数据
print(f.pages)
for p in f.pages:
print(p.extract_text())
if __name__ =='__main__':
# read_pdf1()
read_pdf2()
实时效果反馈
1. 关于Python操作pdf,读取数据说法错误的是?
A 可以根据页码获取数据
B 可以根据page对象获取数据
C pdf.getNumPages()
获取总页码
D pdf.getPage()
获取全部页面数据
答案
1=>D