Статья опубликована в рамках: XC Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 июня 2020 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
РАЗРАБОТКА СЕРВИСА РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ПОЛЕЙ СКАНИРОВАННЫХ ДОКУМЕНТОВ
SELECTING A PLATFORM FOR DEVELOPING A WEB APPLICATION
Dinar Sadriev
student, Department of Computer Systems, Kazan national research technical university Named after A.N. Tupolev - KAI,
Russia, Kazan
Rinar Minyazev
scientific director, candidate of sciences, associate professor at the Department of Computer Systems, Kazan national research technical university Named after A.N. Tupolev - KAI,
Russia, Kazan
АННОТАЦИЯ
В докладе рассматривается разработка онлайн сервиса, реализующего распознавание текстовых полей сканированных документов. Система написана на языке PHP с использованием JavaScript, HTML, CSS. Особенностью данного проекта является компактность и простота в использовании.
ABSTRACT
The report considers the development of an online service that implements the recognition of text fields of scanned documents. The system is written in PHP using JavaScript, HTML, CSS. A feature of this project is compactness and ease of use.
Ключевые слова: хостинг, локальный сервер, MVC, HTML, CSS, PHP, скрипт, распознавание.
Keywords: hosting, local server, MVC, HTML, CSS, PHP, script, recognition.
Постановка задачи
В век компьютерных технологий темп жизни настолько ускорился, что стало очень важным использование любой возможности, чтобы сделать работу как можно быстрее и проще. Перепечатывание документов из бумажного вида в электронный занимает колоссальное количество времени и является очень утомительной деятельностью. Для помощи и ускорения данной работы необходимо создать web-сервис, который будет распознавать текст. Проект должен быть полезен для всех пользователей, желающих быстро получить информацию напечатанного текста в электронном виде.
Структура разрабатываемой системы
На рисунке 1 представлена структура системы распознавания текста. Проект создается на основе технологий оптического распознавания символов.
Рисунок 1. Структура разрабатываемой системы
Согласно архитектурному паттерну MVC каждый модуль подсистемы имеет модель, контроллер и представление. Модули соответствуют ресурсам (объектам) системы. Модели взаимодействуют с данными и реализуют логику работы, контроллеры организуют работы модулей, взаимодействуют с моделями и представлениями, представления отвечают за формирование пользовательского интерфейса [1].
Для взаимодействия клиента с web-сервисом, необходим браузер, который отправляет запрос, файл с текстом, серверу и в ответ получает HTML документы. На сервере этот запрос обрабатывается с помощью языка PHP. Обработка происходит в несколько этапов: проверка загрузки файла, проверка формата файла, конвертирование в нужный формат, процесс распознавания и создание файла с результатом.
Рисунок 2. Обработка запроса на сервере
Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. [2]
В первые данная технология использовалась для распознания документов типа банковских чеков в 1960-х годах. [2] Был создан специальный единый шрифт для всех банковских чеков и машину распознающая текст обучили этому шрифту.
Рисунок 3. Образец единого шрифта для банковских чеков
Однако текстовых шрифтов несколько сотен и обучать каждому шрифту систему является длительным и объемным процессом. Поэтому сегодня системы оптического распознавания символов работают немного иначе. В них задаются некоторые признаки написания букв, к примеру, буква «Т» имеет горизонтальную черту сверху и черту вертикальную по середине и т.д.
Список литературы:
- Руби С. Гибкая разработка веб-приложений, 4-е издание. / Сэм Руби, Дэйв Томас, Дэвид Хэнссон. – Санкт-Петербург: Питер, 2012. – 448 с.
- Википедия. Свободная энциклопедия. Оптическое распознавание символов. – [Электронный ресурс]. URL – http://ru.wikipedia.org/wiki/Оптическое_распознавание_символов
дипломов
Оставить комментарий