Извлекайте текст и метаданные из множества различных шаблонов текста и презентаций на платформе Java с помощью GroupDocs. Анализатор для Java API. Поддерживаются следующие форматы шаблонов:
- точка (Шаблон)
- dotm (шаблон с поддержкой макросов)
- ott (Текстовый шаблон OpenDocument)
- potx (Шаблон)
- potm (шаблон с поддержкой макросов)
- ppsm (слайд-шоу с поддержкой макросов)
- pptm (представление с поддержкой макросов)
Ниже приведены примеры кода, демонстрирующие, как извлекать текст и метаданные из шаблонов.
//Извлечение текста пустой извлеченный текст (строковое имя файла) { //Извлечение текста из файла Строка. ПО УМОЛЧАНИЮ. извлеките текст (имя файла); //Печать извлеченного текста System.out.println(текст); } //Извлечение Метаданных void извлекать данные (строковое имя файла) { //Извлечение метаданных из файла Сбор метаданных.ПО УМОЛЧАНИЮ. извлеките метаданные (имя файла); //Печать извлеченных метаданных для (Строковый ключ: метаданные.getKeys()){ //Печать ключа метаданных System.out.печать (ключ); System.out.печать (“:”); //Печать значения метаданных System.out.println(метаданные.get_Item(ключ)) ; } }
В дополнение к этому, API синтаксического анализа также поддерживает извлечение таблиц из PDF-документов и позволяет определять тип носителя для ваших защищенных документов Office Open XML – http://bit.ly/2CCy7bX
Оригинал: “https://dev.to/groupdocs/how-to-extract-text-and-metadata-from-text-and-presentation-templates-3l1h”