Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LX Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 25 декабря 2017 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Луговая К.А., Фокина В.С. СИСТЕМА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: ОБРАБОТКА НЕСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LX междунар. студ. науч.-практ. конф. № 12(59). URL: https://sibac.info/archive/technic/12(59).pdf (дата обращения: 23.12.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

СИСТЕМА ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: ОБРАБОТКА НЕСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ

Луговая Ксения Александровна

студент ЮРИУ РАНХиГС при Президенте РФ,

РФ, г. Ростов-на-Дону

Фокина Виктория Сергеевна

студент ЮРИУ РАНХиГС при Президенте РФ,

РФ, г. Ростов-на-Дону

Перова Марина Викторовна

научный руководитель,

канд. пед. наук, доцент кафедры информационных технологий, ЮРИУ РАНХиГС при Президенте РФ,

РФ, г. Ростов-на-Дону

Понятие Искусственного Интеллекта (ИИ) принято понимать, как область исследований, изучения и моделирования принципов и механизмов интеллектуальной деятельности человека. Центральной целью, на которую ориентировано изучение искусственного интеллекта является создание работающих моделей разумного поведения, представленного в виде программных или иных технических средств, а также технологий программирования самого этого поведения.

Исходя из природы той области знаний, в которой зародилась ИИ как наука, следует, что на данном этапе становления ИИ находится на пересечении информатики, языкознания, психологии и философии. Кроме того, в сферах применения ИИ используются также и конкретные специальные знания из соответствующей области: естественных наук, медицины, юриспруденции, экономики и т.п. Инженерные методы и навыки в области искусственного интеллекта называют технологией или инженерией знаний (knowledge engineering).

Система искусственного интеллекта в работе с СЭД включает в себя на данный момент:

  • использование естественного языка для общения с ИС;
  • Использование «цифрового следа» пользователя;
  • Поиск информации, аналитика и визуализация информации;

Наука, изучающая искусственный интеллект и имеющая одноименное название зародилась около полувека назад. Первой интеллектуальной системой считается программа "Логик-Теоретик", основным предназначением которой являлось доказательство теорем и исчисление высказываний. За прошедшее с тех пор время, в области ИИ было разработано огромное количество компьютерных систем, именуемых сейчас «интеллектуальными». Области их применения обширна и охватывают практически все сферы человеческой деятельности, связанные с обработкой информации.

Одним из аспектов систем искусственного интеллекта является использование естественного языка для общения с ИС. Это подразумевает использование «лингвистических процессов» на основе convolutional neural network:

  • Выделение ключевых слов и фраз в звуковом/ текстовом поле
  • Распознавание и преобразование в текст естественной речи, включая перевод;
  • «Понимание смысла» произносимого/ записанного текста.

Среди мировых компаний можно выделить несколько лидеров в использовании естественного языка, такие как: Microsoft, Google, Facebook.

Центральные задачи систем искусственного интеллекта состоят в том, чтобы сделать использование компьютеров более продуктивным, а сами компьютеры – полезнее, и чтобы понять принципы, основополагающие тезисы, закономерности, которые лежат в основе интеллекта. В связи с этим ученые, инженеры, а также специалисты и исследователи из других категорий знаний и области наук, специализирующимся в вычислительной технике, необходимо знать, каким образом ИИ может помочь им в разрешение трудных проблем.

На сегодняшний день одной из прорывных инновационных технологий является «Понимание смысла» текста. Этот процесс включает в себя следующие этапы: (рис. 1)

 

Рисунок 1. Понимание смысла текста. Подготовка проекта решения

 

  1. Генерация ответа на письмо:
  • Отправка и получение E-mail;
  • Обработка на сервере;
  • Анализ документа и генерирование ответа на него;
  • Отправка через СЭД.
  1. Подготовка проекта решения:
  • Отправка и получение E-mail;
  • Обработка на сервере;
  • Анализ документа и разработка проекта резолюции;
  • Отправка через СЭД руководителю, подпись;
  • Отправка через СЭД утвержденного решения исполнителям.

Таким образом, можно сделать вывод, что американский ученый и исследователь Марвин Минский внес большой вклад в разработку искусственного интеллекта, что и на сегодняшний день является большим прогрессом. [7]

Обработка неструктурированной информации в настоящее время является крайне актуальной областью применения искусственного интеллекта, ведь на данный момент структурировано не более 20 % мировой информации, тем временем ежегодно в мире генерируется все большее количество данных, причем преимущественно неструктурированных, которые несут потенциально необходимые, полезные сведения для компаний и предприятий. Однако учитывая сложность обработки неструктурированной информации, следует объективный вывод о том, что анализ ее крайне сложен и требует применения комплексных интеллектуальных инструментов.

Сегодня именно неструктурированные данные потенциально имеют наибольшую ценность в качестве источников новых знаний. Парадокс заключается в том, что результат анализа зависит от количества таких данных – чем больше таких данных, тем больше вероятность получить наиболее точные результаты. С этой точки зрения интересна возможность использования для анализа одновременно нескольких дополняющих друг друга источников данных, например, внутреннего корпоративного портала и социальных сетей.

Управление неструктурированной информацией состоит из:

  • Системы управления документами (document management) контролируют процессы создания, редактирования, публикации и архивирования документов.
  • Системы управления Web-контентом (Web-content management), как и системы управления документами, охватывают полный спектр работ, характерных для Интернета (создание, редактирование, публикация и архивирование контента), то есть позволяют работать с презентациями, предназначенными для определенных устройств, позволяют персонализировать контент для конкретного пользователя, в зависимости от времени и т. д.
  • Управление архивами (records management) определяет то, как документы хранятся и удаляются.
  • Управление цифровыми правами (digital rights management) является небольшим, но важным компонентом этой отрасли, так как он обеспечивает безопасный доступ и распространение контента.

В условиях единого процесса, главной целью сотрудничества в области управления контентом является усовершенствование обмена информацией пользователей. Сюда могут входить функции архивирования чатов, конференций на основе "белых досок" (whiteboarding) и т. д.

Иными словами, для сотрудничества в области управления контентом приоритетом в деятельности является усовершенствование средств коммуникации пользователей-участников единого процесса. (Табл. 1)

Таблица 1.

Работа с электронным контентом

Традиционные технологии

Чтение почты и написание ответов

28%

Поиск и сбор информации

19%

Взаимодействие и коммуникации

14%

Выполнение задач

39%

Всего:

100%

 

Согласно статистике IBM, 80 % всех данных в мире не структурированы. В такие цифры сложно поверить. Но факт остаётся фактом — с широким распространением мобильных устройств мы ежедневно генерируем массу цифрового неструктурированного контента: сообщения в мессенджерах, письма, фото и видео.

В помощь при поиске информации были созданы технологии «цифрового следа» пользователя, они облегчают поиск и значительно сужают количество информации для обработки. Анализ деятельности пользователей в СЭД:

  • Построение адаптивного пользовательского интерфейса;
  • Учет информационных предпочтений при поиске, сборе и презентации информации;
  • Использование технологий «контекстной рекламы» для автоматического сбора и выдачи релевантной информации;
  • Обеспечение информационной безопасности;
  • Формирование рабочих групп.

Алгоритмы AI помогают компаниям разобраться с этим “богатством” и структурировать данные так, чтобы впоследствии их проанализировать. Подобный принцип заложен в основе Siri — неструктурированная разговорная речь, проходя через алгоритм программы, становится структурированной и подвергается дальнейшей обработке.

В анализе неструктурированных данных заложен огромный потенциал для производственных и ресурсодобывающих предприятий, которые накапливают смешанную информацию годами. Такой анализ способен облегчить работу и самих R&D инженеров — сэкономить время на сортировку и организацию данных перед тем, как оценить их и проследить важные взаимосвязи.

 

Список литературы:

  1. ГОСТ 15971-90. Системы обработки информации. Термины и определения.
  2. ГОСТ 34.201-89.         Информационная технология. Комплекс стандартов на автоматизированные системы. Виды, комплектность и обозначение документов при создании автоматизированных систем.
  3. Искусственный интеллект. Междисциплинарный подход: моногр.; ИИнтелл - М., 2013. - 448 c.
  4. Тарасов В.Б. (Ред.) Новости искусственного интеллекта, №2, 2004; Российская ассоциация искусственного интеллекта - М., 2014. - 132 c
  5. Рассел С.   Искусственный интеллект. Современный подход     С. Рассел, П. Норвиг. — М.: Вильямс, 2007. — 1410 с.
  6. Осипов Г.С. «искусственный интеллект: состояние исследований и взгляд в будущее» Президент Российской ассоциации искусственного интеллекта, постоянный член ECCAI, д.ф.-м.н., профессор.
  7. Минский М., Паперт С. Искусственный интеллект, Univ. of Oregon Press, 1972
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.