Как преобразовать PDF в Word на Java

В наши дни преобразовать PDF-документы в файлы Word с помощью программного обеспечения не составляет труда. Однако если вы хотите сохранить макет и даже форматирование шрифтов при конвертировании, это не каждому программному обеспечению под силу. Spire.PDF for Java справляется с этой задачей и предлагает вам следующие два режима конвертирования PDF в Word на Java.
1. Конвертирование PDF в Doc/Docx с фиксированным макетом
2. Преобразование PDF в Doc/Docx с плавной структурой
Установите необходимую библиотеку
Spire.PDF for Java — это профессиональная Java-библиотека для чтения, создания и работы с PDF-файлами в Java-приложениях.
Если вы создали проект
Maven, вы можете легко импортировать jar в свое приложение с помощью следующих
конфигураций. Для проектов, не использующих Maven, загрузите
Spire.Pdf.jar и добавьте его в качестве зависимости в ваше приложение.
Режим Fixed Layout
отличается высокой скоростью конвертирования и позволяет максимально сохранить
первоначальный вид PDF-файлов. Однако редактируемость итогового документа будет
ограничена, поскольку каждая строка текста в PDF будет представлена в отдельном фрейме в сгенерированном документе Word. import com.spire.pdf.FileFormat; import com.spire.pdf.PdfDocument; public class ConvertPdfToWordWithFixedLayout { public static void main(String[] args) { //Create a PdfDocument object PdfDocument doc = new PdfDocument(); //Load a sample PDF document doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf"); //Convert PDF to Doc and save it to a specified path doc.saveToFile("output/ToDoc.doc", FileFormat.DOC); //Convert PDF to Docx and save it to a specified path doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX); doc.close(); } } Flowable Structure — это режим полного распознавания.
Преобразованное содержимое не будет представлено в виде фреймов, а структура
итогового документа будет плавной. Сгенерированный документ Word легко
поддается повторному редактированию, но его внешний вид может отличаться от исходного PDF-файла. import com.spire.pdf.FileFormat; import com.spire.pdf.PdfDocument; public class ConvertPdfToWordWithFlowableStructure { public static void main(String[] args) { //Create a PdfDocument object PdfDocument doc = new PdfDocument(); //Load a sample PDF document doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf"); //Convert PDF to Word with flowable structure doc.getConvertOptions().setConvertToWordUsingFlow(true); //Convert PDF to Doc doc.saveToFile("output/ToDoc.doc", FileFormat.DOC); //Convert PDF to Docx doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX); doc.close(); } } В этой статье мы узнали,
как использовать Spire.PDF for Java для преобразования PDF в Word. Кроме того,
эта библиотека поддерживает другие функции обработки PDF, такие как: Извлечение текста
из PDF в Java
Конвертирование PDF в Doc/Docx с фиксированным макетом
Преобразование PDF в Doc/Docx с плавной структурой
Заключение