Иногда вы можете оказаться в ситуации, когда вам нужно извлечь таблицу из PDF-документа и сохранить дату таблицы либо в файле Word, либо на листе Excel, чтобы вы могли свободно редактировать дату. В этой статье я покажу вам, как преобразовать весь PDF-документ в Excel или Word с помощью Spire.PDF для Java .
Ниже приведен скриншот входного файла.
Установить Spire.Pdf.jar
Если вы создаете проект Maven, вы можете легко добавить jar в свое приложение, используя следующие конфигурации. Для проектов, не связанных с Maven, загрузите файл jar с эту ссылку и добавьте ее в качестве зависимости в свое приложение.
com.e-iceblue e-iceblue http://repo.e-iceblue.com/nexus/content/groups/public/ e-iceblue spire.pdf 3.8.5
Конвертировать PDF в Excel (XLS/XLSX)
public class ConvertPdfToExcel {
public static void main(String[] args) {
//Create a PdfDocument instance
PdfDocument pdf = new PdfDocument();
//Load a PDF file
pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\table.pdf");
//Save as Excel file
pdf.saveToFile("ToExcel.xlsx", FileForma.XLSX);
}
}
Выход
Конвертировать PDF в Word (DOC/DOCX)
public class ConvertPdfToWord {
public static void main(String[] args) {
//Create a PdfDocument instance
PdfDocument pdf = new PdfDocument();
//Load a PDF file
pdf.loadFromFile("C:\\Users\\Administrator\\Desktop\\table.pdf");
//Save as Word file
pdf.saveToFile("ToWord.docx", FileFormat.DOCX);
}
}
Выход
Оригинал: “https://dev.to/eiceblue/convert-pdf-to-excel-or-word-in-java-5b8l”