前言

通过Python的PyPDF2库提取pdf中的文字

一、pdfplumber库是什么？

pip install pdfplumber

pip show pdfplumber

import pdfplumber

local = '/Users/kkstar/Downloads/'

with pdfplumber.open(local+"demo.pdf") as pdf:

    num_pages = len(pdf.pages)

    for page_num in range(num_pages):

        page = pdf.pages[page_num]

        text = page.extract_text()

        print(text)

大家好，我是空空star，这是第一页。
大家好，我是空空star，这是第二页。
大家好，我是空空star，这是第三页。

Process finished with exit code 0

0 条评论