Главное Свежее Вакансии Образование
Выбор редакции:
180 0 В избр. Сохранено
Авторизуйтесь
Вход с паролем

Как найти и заменить текст в PDF

В этой статье вы узнаете, как заменить текст на странице PDF или во всем PDF-документе с помощью Python.

Умение находить и заменять текст в документах PDF — ценный навык, имеющий широкое применение. Будь то профессиональные, академические или личные нужды, эта возможность позволяет пользователям эффективно обновлять информацию, обеспечивать точность, поддерживать соответствие требованиям и оптимизировать различные рабочие процессы.

В этой статье вы узнаете, как заменить текст на странице PDF или во всем PDF-документе с помощью Python.

  • Поиск и замена текста на определенной странице PDF
  • Найти и заменить текст во всем PDF-документе

Установите зависимость


Это решение требует установки в качестве зависимости Spire.PDF for Python, которая представляет собой библиотеку Python для чтения, создания и работы с PDF-документами в программах на Python. Вы можете установить ее, выполнив следующую команду pip.

pip install Spire.PDF

Поиск и замена текста на определенной странице PDF


С помощью Spire.PDF вы получаете определенную страницу из PDF с помощью метода PdfDocument.Pages.get_Item(), а затем заменяете целевой текст на новый с помощью метода PdfTextReplacer.ReplaceAllText().

from spire.pdf import *

from spire.pdf.common import *

# Create a PdfDocument object

doc = PdfDocument()

# Load a PDF document

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\Input.pdf")

# Get a specific page

page = doc.Pages.get_Item(0)

# Create an object of PdfTextReplacer class

replacer = PdfTextReplacer(page)

# Replace the target text with new text

replacer.ReplaceAllText("old string«, «new string»)

# Save the document

doc.SaveToFile("ReplaceTextInPage.pdf")

# Dispose resources

doc.Dispose()

Найти и заменить текст во всем PDF-документе


Теперь вы узнали, как заменить текст на определенной странице PDF-документа. Вы перебираете страницы документа с помощью цикла for и заменяете текст на этих страницах по очереди.

from spire.pdf import *

from spire.pdf.common import *

# Create a PdfDocument object

doc = PdfDocument()

# Load a PDF document

doc.LoadFromFile("C:\\Users\\Administrator\\Desktop\\Input.pdf")

# Iterate through the pages

for i in range(doc.Pages.Count):

# Get a specific page

page = doc.Pages.get_Item(i)

# Create an object of PdfTextReplacer class

replacer = PdfTextReplacer(page)

# Replace the target text with new text

replacer.ReplaceAllText("old string«, «new string»)

# Save the document

doc.SaveToFile("ReplaceTextInDocument.pdf")

# Dispose resources

doc.Dispose()

Заключение


В этой статье мы узнали, как прикреплять файлы к PDF-документам в Python. Spire.PDF for Python, будучи мощной библиотекой Python, позволяет разработчикам выполнять широкий спектр операций с PDF-документами, таких как:

Извлечение вложений из PDF в Python

Преобразование PDF в Word с помощью Python

Преобразование PDF в изображения с помощью Python

0
В избр. Сохранено
Авторизуйтесь
Вход с паролем
Комментарии
Выбрать файл
Блог проекта
Расскажите историю о создании или развитии проекта, поиске команды, проблемах и решениях
Написать
Личный блог
Продвигайте свои услуги или личный бренд через интересные кейсы и статьи
Написать

Spark использует cookie-файлы. С их помощью мы улучшаем работу нашего сайта и ваше взаимодействие с ним.