OCR Test - Works offline 0.6.0

Лицензии: Бесплатный ‎Размер файла: 10.49 MB
‎Рейтинг пользователей: 2.8/5 - ‎6 ‎Голосов

О OCR Test - Works offline

Экспериментальное приложение для оптического распознавания символов (OCR) Это приложение является экспериментальным приложением, которое я разработал несколько лет назад, что демонстрирует использование двигателя Tesseract OCR для распознавания текста в изображениях, захваченных камерой устройства. Это приложение работает OCR на вашем устройстве ndash; без загрузки изображений на сервер ndash; и подходит для распознавания отдельных слов или коротких фраз текста, но это приложение предназначено для любителей и разработчиков программного обеспечения, заинтересованных в OCR, а не для общей аудитории. В отличие от Google Mobile Vision API, это приложение может распознавать текст, напечатанный в не-латинских шрифтов в то время как в автономном режиме. Для достижения этой цели, это приложение включает в себя необычно большой объем учебных данных для нескольких языков. Эти учебные данные хранятся на вашем телефоне, и это приложение занимает гораздо больше места, чем обычные приложения. Никакая предварительная обработка изображения не выполняется этим приложением перед передачей захваченных кадров изображения Tesseract, поэтому приложение не настроено для какого-либо конкретного случая использования и, как следствие, его точность и скорость распознавания сильно зависит от ситуационных факторов, таких как перспектива, освещение и тип шрифта. Исходный код этого приложения доступен на GitHub (с незначительными изменениями для размещения ограничений размера файла GitHub). Код для этого приложения представляет собой комбинацию кода, связанного с камерой с открытым исходным кодом, из проекта сканера штрих-кода «Хинг» и кода распознавания символов с открытым исходным кодом из проекта Tesseract OCR. ЗАХВАТ ТЕКСТА По умолчанию одноразовый захват выполняет OCR на снимке, который запечатлен при нажатии кнопки затвора, как обычное фото. При проверке флажка "непрерывного предварительного просмотра" приложение показывает динамический отображение в режиме реального времени того, что устройство распознает прямо рядом с видоискателем камеры. Режим непрерывного предварительного просмотра лучше всего работает на быстром устройстве. ИСПОЛЬЗОВАНИЕ ЭТОГО ПРИЛОЖЕНИЯ «Бык; Навечьте устройство на небольшой области текста и коснитесь кнопки затвора на экране, чтобы начать OCR. Для распознавания отдельных китайских/японских/корейских символов установите режим сегментации страницы до "единого символа". ТОЧНОСТЬ РАСПОЗНАВАНИЯ «Бык; Различные факторы могут привести к провалу OCR: неравномерное освещение, стилизованный текст или текст без достаточного контраста с фоном. Постарайтесь иметь хорошее освещение. Бык; Держите устройство устойчивым, и убедитесь, что картина находится в центре внимания. Если вам нужно сканировать большой блок текста или весь документ, попробуйте приложение для сканирования документов, такое как Text Fairy. Языки «Бык; Это приложение поддерживает несколько языков/скриптов, не признанных Google Translate. «бык; Поддерживаемые языки для OCR: африкаанс албанский Амхарский арабский Ассамский Азербайджана Азербайджанский (кириллица) баскский белорусский бенгальский боснийский болгарский Бирманский каталанский Кебуано Чероки Китайский (упрощенный) Китайский (традиционный) хорватский чешский датский нидерландский Дзонгха английский Английский, Средний (1100-1500) Эсперанто эстонский финский Франкского французский Французский, Средний (ок. 1400-1600) галисийский грузинский Грузинский - Старый немецкий Греческий, Древний (-1453) Греческий, Современный (1453-) гуджарати Гаити иврит хинди венгерский исландский индонезийский Инуктитут ирландский итальянский Итальянский - Старый японский Яванский каннада казахский Кхмерской корейский Курдский киргизский Лао Латинской латышский литовский Македонец малайский малаялам мальтийский маратхи Непальский норвежский Ория Пушту персидский польский португальский панджаби румынский русский санскрит сербский Сербский (латинский) Синхала словацкий словенский испанский Испанский - Старый суахили шведский Сирийский Тагальский Таджикский тамильский телугу тайский Тибетский Тигринья турецкий украинский урду Уйгурский узбекский узбекский (кириллица) вьетнамский валлийский Идиш SAMSUNG УСТРОЙСТВО ОТМЕЧАЕТ, На устройствах Samsung Galaxy вам может понадобиться длительное нажимать кнопку меню, чтобы установить предпочтения.