Я искал приложение для извлечения текста на изображениях для арабского языка. Я не смог найти ни одного приложения без доступа в Интернет для платформы Android. но после нескольких дней поисков я нашел два приложения.. но точность распознавания ужасна!
Я решил создать Приложение для распознавания текста на арабском языке для Android . Я начал год назад, 6 октября 2018 года. Это было великое, но печальное решение. Я столкнулся со слишком многими трудностями.
Существует применение JNI для Android, которое мне трудно писать и с которым трудно иметь дело. Поэтому мне нужно ознакомиться с разработкой в CPP с Java с использованием JNI. Затем я столкнулся с другим препятствием, которое заключается в плохой точности обученных моделей для идентификации арабских языков для библиотеки tesseract OCR.
Я искал библиотеку tesseract 4.0 для Android, и LSTM обучил данные с высочайшей точностью. После слишком большого количества повторений и неудач в течение одного ооооочень долгого года я добился успеха!
Наконец, мне удалось сделать приложение OCR точным, работающим в автономном режиме и простым в использовании. Ты можешь им воспользоваться! это здесь .
Я узнал, что разработка программного обеспечения – это итеративный процесс не одномоментный успех.. исследование – это ваш первый шаг и не зацикливайтесь на экспериментах без исследований.. используйте библиотеки и не изобретайте велосипед заново (стойте на плечах гигантов).
Если у вас есть какие-либо предложения или советы, сообщите мне в комментариях. Спасибо.
Оригинал: “https://dev.to/devabanoub/what-i-learned-from-developing-arabic-ocr-android-app-4286”