Как преобразовать PDF в HTML в Java

Формат PDF обеспечивает единообразное представление документов на разных устройствах. Однако если вам нужно поместить PDF-документы на веб-страницы, лучше преобразовать их в HTML-файлы. В этом случае все содержимое документа будет отображаться в браузере напрямую, без необходимости загрузки файлов. Кроме того, по сравнению с PDF-файлами, поисковым системам гораздо проще просматривать HTML-страницы для получения информации, что позволит вашему сайту получить большее распространение. В этой статье мы расскажем, как конвертировать PDF-документы в HTML-файлы на Java с помощью Free Spire.PDF for Java.
- Преобразование PDF-документа в HTML-файл на Java
- Преобразование PDF-документа в HTML-поток в Java
Установка файла Free Spire.Pdf.jar
Если вы создали
Maven-проект, вы можете легко импортировать jar в свое приложение, используя следующие
конфигурации. Для проектов, не использующих Maven, загрузите jar-файл по этой ссылке
и добавьте его в качестве зависимости в свое приложение.
С помощью Spire.PDF для Java вы можете загрузить PDF-файл с помощью метода PdfDocument.loadfFromFile() и преобразовать его в HTML-файл с помощью метода PdfDocument.saveToFile(). import com.spire.pdf.*; public class convertPDFToHTML { public static void main(String[] args) { //Create an object of PdfDocument PdfDocument pdf = new PdfDocument(); //Load a PDF file pdf.loadFromFile("C:/Guide to a Foreign Past.pdf"); //Save the PDF file as an HTML file pdf.saveToFile("PDFToHTML.html",FileFormat.HTML); pdf.close(); } } Вместо того чтобы
преобразовывать PDF в HTML-файл, вы также можете преобразовать его в HTML-поток
с помощью метода PdfDocument.saveToStream(). В следующем коде приведен пример. import com.spire.pdf.*; import java.io.*; public class convertPDFToHTMLStream { public static void main(String[] args) throws FileNotFoundException { //Create an object of PdfDocument PdfDocument pdf = new PdfDocument(); //Load a PDF file pdf.loadFromFile("C:/Guide to a Foreign Past.pdf"); //Save the PDF file as HTML stream File outFile = new File("PDFToHTMLStream.html"); OutputStream outputStream = new FileOutputStream(outFile); pdf.saveToStream(outputStream, FileFormat.HTML); pdf.close(); } } В этой статье мы узнали, как с помощью Free Spire.PDF for Java конвертировать PDF в HTML. Кроме того, компонент поддерживает другие функции обработки PDF, такие как: Преобразование
PDF в изображения в Java
Преобразование PDF-документа в HTML-файл на Java
Преобразование PDF-документа в HTML-поток в Java
Резюме