Как извлечь текст и метаданные из шаблонов текста и презентаций

Извлекайте текст и метаданные из множества различных шаблонов текста и презентаций на платформе Java с помощью GroupDocs. Анализатор для Java API. Поддерживаются следующие форматы шаблонов:

точка (Шаблон)
dotm (шаблон с поддержкой макросов)
ott (Текстовый шаблон OpenDocument)
potx (Шаблон)
potm (шаблон с поддержкой макросов)
ppsm (слайд-шоу с поддержкой макросов)
pptm (представление с поддержкой макросов)

Ниже приведены примеры кода, демонстрирующие, как извлекать текст и метаданные из шаблонов.

//Извлечение текста пустой извлеченный текст (строковое имя файла) { //Извлечение текста из файла Строка. ПО УМОЛЧАНИЮ. извлеките текст (имя файла); //Печать извлеченного текста System.out.println(текст); } //Извлечение Метаданных void извлекать данные (строковое имя файла) { //Извлечение метаданных из файла Сбор метаданных.ПО УМОЛЧАНИЮ. извлеките метаданные (имя файла); //Печать извлеченных метаданных для (Строковый ключ: метаданные.getKeys()){ //Печать ключа метаданных System.out.печать (ключ); System.out.печать (“:”); //Печать значения метаданных System.out.println(метаданные.get_Item(ключ)) ; } }

В дополнение к этому, API синтаксического анализа также поддерживает извлечение таблиц из PDF-документов и позволяет определять тип носителя для ваших защищенных документов Office Open XML – http://bit.ly/2CCy7bX

Оригинал: “https://dev.to/groupdocs/how-to-extract-text-and-metadata-from-text-and-presentation-templates-3l1h”

Читайте ещё по теме: