Как извлечь вложения из PDF на диск в Java
Формат PDF содержит встроенные вложения, причем вложением может быть что угодно. Это может быть сам PDF-документ, документ Excel, Word, PowerPoint или файл изображения. В этой статье я покажу, как извлечь вложения из PDF-документа и сохранить их на диске с помощью Free Spire.PDF for Java.
Ниже приведен снимок экрана входного документа.

Установка Spire.Pdf.jar
Если вы создали
Maven-проект, вы можете легко импортировать jar в свое приложение, используя
следующие конфигурации. Для проектов, не использующих Maven, загрузите jar-файл
по этой
ссылке и добавьте его в качестве зависимости в свое приложение.
import com.spire.pdf.PdfDocument; import com.spire.pdf.attachments.PdfAttachmentCollection; import java.io.*; public class ExtractAttachmentsFromPDF { public static void main(String[] args) throws IOException { //Create a PdfDocument object PdfDocument pdf = new PdfDocument(); //Load the sample pdf document pdf.loadFromFile("C:\Users\Administrator\Desktop\Attachments.pdf"); //Get the attachment collection from pdf PdfAttachmentCollection attachments = pdf.getAttachments(); //Loop through the attachments for (int i = 0; i < attachments.getCount(); i++) { //Create a new file based on the name of the specific attachment File file = new File("attachments/" + attachments.get(i).getFileName()); //Write data to the new file OutputStream output = new FileOutputStream(file); BufferedOutputStream bufferedOutput = new BufferedOutputStream(output); bufferedOutput.write(attachments.get(i).getData()); bufferedOutput.close(); } } }
Извлечение вложений из PDF в Python
