Рубрики
Без рубрики

Ответ: Использование PDFBox для определения координат слов в документе

Я работаю над извлечением данных из PDF-файлов. Этот пост помогает мне определить положение координат… Помеченный java, pdfbox.

Я работаю над извлечением данных из PDF-файлов. Этот пост помогает мне определить положение координат с помощью поиска по слову.

взгляните на это, я думаю, это то, что вам нужно.

взгляните на это, я думаю, это то, что вам нужно.

Вот код:

import java.io.File;
import java.io.IOException;
import java.text.DecimalFormat;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

import org.apache.pdfbox.exceptions.InvalidPasswordException;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.common.PDStream;
import org.apache.pdfbox.util.PDFTextStripper;
import org.apache.pdfbox.util.TextPosition;

public class PrintTextLocations extends PDFTextStripper {

public static StringBuilder tWord

Оригинал: “https://dev.to/ikungolf/answer-using-pdfbox-to-determine-the-coordinates-of-words-in-a-document-3ac4”