Как преобразовать PDF в Word на Java

В наши дни преобразовать PDF-документы в файлы Word с помощью программного обеспечения не составляет труда. Однако если вы хотите сохранить макет и даже форматирование шрифтов при конвертировании, это не каждому программному обеспечению под силу. Spire.PDF for Java справляется с этой задачей и предлагает вам следующие два режима конвертирования PDF в Word на Java.
1. Конвертирование PDF в Doc/Docx с фиксированным макетом
2. Преобразование PDF в Doc/Docx с плавной структурой
Установите необходимую библиотеку
Spire.PDF for Java — это профессиональная Java-библиотека для чтения, создания и работы с PDF-файлами в Java-приложениях.
Если вы создали проект Maven, вы можете легко импортировать jar в свое приложение с помощью следующих конфигураций. Для проектов, не использующих Maven, загрузите Spire.Pdf.jar и добавьте его в качестве зависимости в ваше приложение.

Конвертирование PDF в Doc/Docx с фиксированным макетом
Режим Fixed Layout отличается высокой скоростью конвертирования и позволяет максимально сохранить первоначальный вид PDF-файлов. Однако редактируемость итогового документа будет ограничена, поскольку каждая строка текста в PDF будет представлена в отдельном фрейме в сгенерированном документе Word.
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFixedLayout {
public static void main(String[] args) {
//Create a PdfDocument object
PdfDocument doc = new PdfDocument();
//Load a sample PDF document
doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");
//Convert PDF to Doc and save it to a specified path
doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);
//Convert PDF to Docx and save it to a specified path
doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
Преобразование PDF в Doc/Docx с плавной структурой
Flowable Structure — это режим полного распознавания. Преобразованное содержимое не будет представлено в виде фреймов, а структура итогового документа будет плавной. Сгенерированный документ Word легко поддается повторному редактированию, но его внешний вид может отличаться от исходного PDF-файла.
import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;
public class ConvertPdfToWordWithFlowableStructure {
public static void main(String[] args) {
//Create a PdfDocument object
PdfDocument doc = new PdfDocument();
//Load a sample PDF document
doc.loadFromFile("C:\Users\Administrator\Desktop\sample.pdf");
//Convert PDF to Word with flowable structure
doc.getConvertOptions().setConvertToWordUsingFlow(true);
//Convert PDF to Doc
doc.saveToFile("output/ToDoc.doc", FileFormat.DOC);
//Convert PDF to Docx
doc.saveToFile("output/ToDocx.docx", FileFormat.DOCX);
doc.close();
}
}
Заключение
В этой статье мы узнали, как использовать Spire.PDF for Java для преобразования PDF в Word. Кроме того, эта библиотека поддерживает другие функции обработки PDF, такие как:
Извлечение текста из PDF в Java