Статья опубликована в рамках: LX Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 25 декабря 2017 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
СИСТЕМА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: ОБРАБОТКА НЕСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ
Понятие Искусственного Интеллекта (ИИ) принято понимать, как область исследований, изучения и моделирования принципов и механизмов интеллектуальной деятельности человека. Центральной целью, на которую ориентировано изучение искусственного интеллекта является создание работающих моделей разумного поведения, представленного в виде программных или иных технических средств, а также технологий программирования самого этого поведения.
Исходя из природы той области знаний, в которой зародилась ИИ как наука, следует, что на данном этапе становления ИИ находится на пересечении информатики, языкознания, психологии и философии. Кроме того, в сферах применения ИИ используются также и конкретные специальные знания из соответствующей области: естественных наук, медицины, юриспруденции, экономики и т.п. Инженерные методы и навыки в области искусственного интеллекта называют технологией или инженерией знаний (knowledge engineering).
Система искусственного интеллекта в работе с СЭД включает в себя на данный момент:
- использование естественного языка для общения с ИС;
- Использование «цифрового следа» пользователя;
- Поиск информации, аналитика и визуализация информации;
Наука, изучающая искусственный интеллект и имеющая одноименное название зародилась около полувека назад. Первой интеллектуальной системой считается программа "Логик-Теоретик", основным предназначением которой являлось доказательство теорем и исчисление высказываний. За прошедшее с тех пор время, в области ИИ было разработано огромное количество компьютерных систем, именуемых сейчас «интеллектуальными». Области их применения обширна и охватывают практически все сферы человеческой деятельности, связанные с обработкой информации.
Одним из аспектов систем искусственного интеллекта является использование естественного языка для общения с ИС. Это подразумевает использование «лингвистических процессов» на основе convolutional neural network:
- Выделение ключевых слов и фраз в звуковом/ текстовом поле
- Распознавание и преобразование в текст естественной речи, включая перевод;
- «Понимание смысла» произносимого/ записанного текста.
Среди мировых компаний можно выделить несколько лидеров в использовании естественного языка, такие как: Microsoft, Google, Facebook.
Центральные задачи систем искусственного интеллекта состоят в том, чтобы сделать использование компьютеров более продуктивным, а сами компьютеры – полезнее, и чтобы понять принципы, основополагающие тезисы, закономерности, которые лежат в основе интеллекта. В связи с этим ученые, инженеры, а также специалисты и исследователи из других категорий знаний и области наук, специализирующимся в вычислительной технике, необходимо знать, каким образом ИИ может помочь им в разрешение трудных проблем.
На сегодняшний день одной из прорывных инновационных технологий является «Понимание смысла» текста. Этот процесс включает в себя следующие этапы: (рис. 1)
Рисунок 1. Понимание смысла текста. Подготовка проекта решения
- Генерация ответа на письмо:
- Отправка и получение E-mail;
- Обработка на сервере;
- Анализ документа и генерирование ответа на него;
- Отправка через СЭД.
- Подготовка проекта решения:
- Отправка и получение E-mail;
- Обработка на сервере;
- Анализ документа и разработка проекта резолюции;
- Отправка через СЭД руководителю, подпись;
- Отправка через СЭД утвержденного решения исполнителям.
Таким образом, можно сделать вывод, что американский ученый и исследователь Марвин Минский внес большой вклад в разработку искусственного интеллекта, что и на сегодняшний день является большим прогрессом. [7]
Обработка неструктурированной информации в настоящее время является крайне актуальной областью применения искусственного интеллекта, ведь на данный момент структурировано не более 20 % мировой информации, тем временем ежегодно в мире генерируется все большее количество данных, причем преимущественно неструктурированных, которые несут потенциально необходимые, полезные сведения для компаний и предприятий. Однако учитывая сложность обработки неструктурированной информации, следует объективный вывод о том, что анализ ее крайне сложен и требует применения комплексных интеллектуальных инструментов.
Сегодня именно неструктурированные данные потенциально имеют наибольшую ценность в качестве источников новых знаний. Парадокс заключается в том, что результат анализа зависит от количества таких данных – чем больше таких данных, тем больше вероятность получить наиболее точные результаты. С этой точки зрения интересна возможность использования для анализа одновременно нескольких дополняющих друг друга источников данных, например, внутреннего корпоративного портала и социальных сетей.
Управление неструктурированной информацией состоит из:
- Системы управления документами (document management) контролируют процессы создания, редактирования, публикации и архивирования документов.
- Системы управления Web-контентом (Web-content management), как и системы управления документами, охватывают полный спектр работ, характерных для Интернета (создание, редактирование, публикация и архивирование контента), то есть позволяют работать с презентациями, предназначенными для определенных устройств, позволяют персонализировать контент для конкретного пользователя, в зависимости от времени и т. д.
- Управление архивами (records management) определяет то, как документы хранятся и удаляются.
- Управление цифровыми правами (digital rights management) является небольшим, но важным компонентом этой отрасли, так как он обеспечивает безопасный доступ и распространение контента.
В условиях единого процесса, главной целью сотрудничества в области управления контентом является усовершенствование обмена информацией пользователей. Сюда могут входить функции архивирования чатов, конференций на основе "белых досок" (whiteboarding) и т. д.
Иными словами, для сотрудничества в области управления контентом приоритетом в деятельности является усовершенствование средств коммуникации пользователей-участников единого процесса. (Табл. 1)
Таблица 1.
Работа с электронным контентом
Традиционные технологии |
|
Чтение почты и написание ответов |
28% |
Поиск и сбор информации |
19% |
Взаимодействие и коммуникации |
14% |
Выполнение задач |
39% |
Всего: |
100% |
Согласно статистике IBM, 80 % всех данных в мире не структурированы. В такие цифры сложно поверить. Но факт остаётся фактом — с широким распространением мобильных устройств мы ежедневно генерируем массу цифрового неструктурированного контента: сообщения в мессенджерах, письма, фото и видео.
В помощь при поиске информации были созданы технологии «цифрового следа» пользователя, они облегчают поиск и значительно сужают количество информации для обработки. Анализ деятельности пользователей в СЭД:
- Построение адаптивного пользовательского интерфейса;
- Учет информационных предпочтений при поиске, сборе и презентации информации;
- Использование технологий «контекстной рекламы» для автоматического сбора и выдачи релевантной информации;
- Обеспечение информационной безопасности;
- Формирование рабочих групп.
Алгоритмы AI помогают компаниям разобраться с этим “богатством” и структурировать данные так, чтобы впоследствии их проанализировать. Подобный принцип заложен в основе Siri — неструктурированная разговорная речь, проходя через алгоритм программы, становится структурированной и подвергается дальнейшей обработке.
В анализе неструктурированных данных заложен огромный потенциал для производственных и ресурсодобывающих предприятий, которые накапливают смешанную информацию годами. Такой анализ способен облегчить работу и самих R&D инженеров — сэкономить время на сортировку и организацию данных перед тем, как оценить их и проследить важные взаимосвязи.
Список литературы:
- ГОСТ 15971-90. Системы обработки информации. Термины и определения.
- ГОСТ 34.201-89. Информационная технология. Комплекс стандартов на автоматизированные системы. Виды, комплектность и обозначение документов при создании автоматизированных систем.
- Искусственный интеллект. Междисциплинарный подход: моногр.; ИИнтелл - М., 2013. - 448 c.
- Тарасов В.Б. (Ред.) Новости искусственного интеллекта, №2, 2004; Российская ассоциация искусственного интеллекта - М., 2014. - 132 c
- Рассел С. Искусственный интеллект. Современный подход С. Рассел, П. Норвиг. — М.: Вильямс, 2007. — 1410 с.
- Осипов Г.С. «искусственный интеллект: состояние исследований и взгляд в будущее» Президент Российской ассоциации искусственного интеллекта, постоянный член ECCAI, д.ф.-м.н., профессор.
- Минский М., Паперт С. Искусственный интеллект, Univ. of Oregon Press, 1972
дипломов
Оставить комментарий