Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XC Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 08 июня 2020 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Садриев Д.З. РАЗРАБОТКА СЕРВИСА РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ПОЛЕЙ СКАНИРОВАННЫХ ДОКУМЕНТОВ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. XC междунар. студ. науч.-практ. конф. № 6(89). URL: https://sibac.info/archive/technic/6(89).pdf (дата обращения: 22.11.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

РАЗРАБОТКА СЕРВИСА РАСПОЗНАВАНИЯ ТЕКСТОВЫХ ПОЛЕЙ СКАНИРОВАННЫХ ДОКУМЕНТОВ

Садриев Динар Зульфатович

студент, кафедра компьютерных систем, Казанский национальный исследовательский технический университет имени А.Н. Туполева-КАИ,

РФ, г. Казань

Минязев Ринат Шавкатович

научный руководитель,

канд. техн. наук, доц. кафедры компьютерных систем, Казанский национальный исследовательский технический университет имени А.Н. Туполева-КАИ,

РФ, г. Казань

SELECTING A PLATFORM FOR DEVELOPING A WEB APPLICATION

 

Dinar Sadriev

student, Department of Computer Systems, Kazan national research technical university Named after A.N. Tupolev - KAI,

Russia, Kazan

Rinar Minyazev

scientific director, candidate of sciences, associate professor at the Department of Computer Systems, Kazan national research technical university Named after A.N. Tupolev - KAI,

Russia, Kazan

 

АННОТАЦИЯ

В докладе рассматривается разработка онлайн сервиса, реализующего распознавание текстовых полей сканированных документов. Система написана на языке PHP с использованием JavaScript, HTML, CSS. Особенностью данного проекта является компактность и простота в использовании.

ABSTRACT

The report considers the development of an online service that implements the recognition of text fields of scanned documents. The system is written in PHP using JavaScript, HTML, CSS. A feature of this project is compactness and ease of use.

 

Ключевые слова: хостинг, локальный сервер, MVC, HTML, CSS, PHP, скрипт, распознавание.

Keywords: hosting, local server, MVC, HTML, CSS, PHP, script, recognition.

 

Постановка задачи

В век компьютерных технологий темп жизни настолько ускорился, что стало очень важным использование любой возможности, чтобы сделать работу как можно быстрее и проще. Перепечатывание документов из бумажного вида в электронный занимает колоссальное количество времени и является очень утомительной деятельностью. Для помощи и ускорения данной работы необходимо создать web-сервис, который будет распознавать текст. Проект должен быть полезен для всех пользователей, желающих быстро получить информацию напечатанного текста в электронном виде.

Структура разрабатываемой системы

На рисунке 1 представлена структура системы распознавания текста. Проект создается на основе технологий оптического распознавания символов.

 

Рисунок 1. Структура разрабатываемой системы

 

Согласно архитектурному паттерну MVC каждый модуль подсистемы имеет модель, контроллер и представление. Модули соответствуют ресурсам (объектам) системы. Модели взаимодействуют с данными и реализуют логику работы, контроллеры организуют работы модулей, взаимодействуют с моделями и представлениями, представления отвечают за формирование пользовательского интерфейса [1].

Для взаимодействия клиента с web-сервисом, необходим браузер, который отправляет запрос, файл с текстом, серверу и в ответ получает HTML документы. На сервере этот запрос обрабатывается с помощью языка PHP. Обработка происходит в несколько этапов: проверка загрузки файла, проверка формата файла, конвертирование в нужный формат, процесс распознавания и создание файла с результатом.

 

Рисунок 2. Обработка запроса на сервере

 

Оптическое распознавание символов (англ. optical character recognition, OCR) — механический или электронный перевод изображений рукописного, машинописного или печатного текста в текстовые данные, использующиеся для представления символов в компьютере (например, в текстовом редакторе). Распознавание широко применяется для преобразования книг и документов в электронный вид, для автоматизации систем учёта в бизнесе или для публикации текста на веб-странице. Оптическое распознавание символов позволяет редактировать текст, осуществлять поиск слов или фраз, хранить его в более компактной форме, демонстрировать или распечатывать материал, не теряя качества, анализировать информацию, а также применять к тексту электронный перевод, форматирование или преобразование в речь. Оптическое распознавание текста является исследуемой проблемой в областях распознавания образов, искусственного интеллекта и компьютерного зрения. [2]

В первые данная технология использовалась для распознания документов типа банковских чеков в 1960-х годах. [2] Был создан специальный единый шрифт для всех банковских чеков и машину распознающая текст обучили этому шрифту.

 

Рисунок 3. Образец единого шрифта для банковских чеков

 

Однако текстовых шрифтов несколько сотен и обучать каждому шрифту систему является длительным и объемным процессом. Поэтому сегодня системы оптического распознавания символов работают немного иначе. В них задаются некоторые признаки написания букв, к примеру, буква «Т» имеет горизонтальную черту сверху и черту вертикальную по середине и т.д.       

 

Список литературы:

  1. Руби С. Гибкая разработка веб-приложений, 4-е издание. / Сэм Руби, Дэйв Томас, Дэвид Хэнссон. – Санкт-Петербург: Питер, 2012. – 448 с.
  2. Википедия. Свободная энциклопедия. Оптическое распознавание символов. – [Электронный ресурс]. URL – http://ru.wikipedia.org/wiki/Оптическое_распознавание_символов
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.