Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: VIII Международной научно-практической конференции «Физико-математические науки и информационные технологии: проблемы и тенденции развития» (Россия, г. Новосибирск, 26 ноября 2012 г.)

Наука: Информационные технологии

Секция: Системный анализ, управление и обработка информации

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Топчий А.В. РАБОТА СО СЛАБОСТРУКТУРИРОВАННЫМИ ДАННЫМИ // Физико-математические науки и информационные технологии: проблемы и тенденции развития: сб. ст. по матер. VIII междунар. науч.-практ. конф. № 8. – Новосибирск: СибАК, 2012.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов
Статья опубликована в рамках:
 
 
Выходные данные сборника:


 


РАБОТА СО СЛАБОСТРУКТУРИРОВАННЫМИ ДАННЫМИ


Топчий Антон Владимирович


аспирант ИСОиП (филиал) ДГТУ г. Шахты


E-mailanton_s.topchiy@mail.ru


 


Введение


В современном обществе роль и значение информации довольно высоки. Это обусловлено постоянным усложнением нашего общества и соответственно усложнением взаимоотношений в обществе, что приводит к увеличению количества информационных потоков и непосредственно данных. В результате всё чаще появляется необходимость извлечения определённой информации из слабоструктурированных данных.


Такая потребность может возникнуть, например, при работе с прецедентами. Прецедент можно определить как событие, произошедшее ранее, и являющееся примером для выработки действий в аналогичных случаях [1]. При работе с прецедентами не всегда их можно описать одинаково, таким образом имеется смысл в применении технологий позволяющих извлекать информацию из слабоструктурированных данных. Что позволит значительно упростить разработку системы работающей с прецедентами и не только с ними. Такие технологии позволят упростить разработку и других систем, которые должны осуществлять работу со слабоструктурированной информацией.


В свою очередь целями работы является поиск модели позволяющей извлекать из слабоструктурированных данных требуемую информацию, и разработка модуля, в котором программно реализован эта модель. При разработке модуля нужно учитывать следующие условия:


·Модуль должен работать с объектами, которые содержат информацию о данных.


·Объекты для хранения данных должны иметь как можно более простую структуру.


·Сам модуль и объекты для хранения данных при работе должны быть полностью независимыми друг от друга.


·Модуль должен извлекать из слабоструктурированных данных необходимую информацию.


·Для тестирования модуля должна быть написана простая программа, дающая возможность использовать все возможности модуля, которые будут реализованы.


Поиск метода.


Для реализации поставленных задач в качестве базовой модели была выбрана «Сетевая модель» разработанная Коллинзом А. и Квиллианом Р. (1968). Модель является множеством объектов, каждый из которых имеет набор свойств описывающих субъективно выбранный элемент реального мира. Все объекты модели связаны друг с другом логическими отношениями (рисунок 1) [4].



Рисунок 1. Сетевая модель Коллинза А. и Квиллиана Р. (1968) [4].


 


Сетевая модель Коллинза и Квиллиана может применяться для представления некоторого количество элементов реального мира в слабоструктурированном виде.


Сетевая модель имеет сходства с «Семантической моделью данных» разработанной Хаммером М. и Маклеодом Д. в 1981 году [3]. К сходствам этих моделей можно отнести, то, что в них объекты являются абстракциями событий и сущностей реального мира. Свойства объектов, как в сетевой модели, так и в семантической модели данных описываются атрибутами [3, 4].


Ориентируясь на сетевую модель, была выработана структура базового элемента для мульти-агентной системы, которая в общих чертах упоминалась в докладе «Анализ и структурирование данных» [5]. У неё такие же сходства с семантической моделью данных, как и у сетевой модели, что в свою очередь добавило теоретической обоснованности идее и упростило разработку модуля на основе мульти-агентной системы.


Базовый элемент для мульти-агентной системы имеет следующее строение (рисунок 2) [5]:


·     Название, хранит имя сущности реального мира, которая отражена в объекте.


·     Функциональная часть, содержит все функции, которые сможет выполнять объект.


·     Свойства объекта, описывают параметры сущности хранимой в нём.


·    Вход-выход, эта часть объекта предназначена для осуществления взаимосвязи с другими объектами и внешней средой.



Рисунок 2. Базовый элемент для мульти-агентной системы [5].


 


Мульти-агентная система состоит из множества агентов (см. рис. 2), в которых описаны сущности реального мира. Все агенты взаимосвязаны между собой и работают как единая система. Для полноценного объединения всех элементов, предполагается использовать хранилище объектов, которое должно осуществлять внешние функции управления системой и являться для всех объектов внешней средой [5].


Реализация метода.


Для реализации мульти-агентной системы было решено использовать Delphi 7. Основанием для выбора среды послужило субъективное предпочтение и умение работать в среде Delphi 7, а также её достаточно широкие возможности для разработки программ [6].


В результате проделанной работы была написана программа, состоящая из «Внешнего интерфейса» и самого модуля содержащего мульти-агентную систему.


Внешний интерфейс является простой программой, которая позволяет использовать реализованные возможности модуля:


·     Загрузку массива объектов;


·     Осуществление запроса на поиск объектов по введённым параметрам;


·     Взятие результатов работы модуля.


Модуль мульти-агентной системы является функционально независимым и может быть подключён к любой программе. Он состоит из нескольких условно и функционально различающихся частей:


·     Интерфейса модуля — набора функций, которые позволяют работать с модулем.


·     Хранилища объектов — предназначенного для хранения объектов и управления ими.


·   Пространства объектов — n-го количества объектов, в которых описаны сущности реального мира. Предполагается, что их максимальное количество не ограничено.


В работе модуля есть несколько особенностей, которые позволяют говорить, что в нём реализована мульти-агентная система. Первой из них является, то, что хранилище объектов и сами объекты функционально независимы. Т. е. процедура передаёт команду объекту и на этом завершается, в объекте в свою очередь запускается выполнение этой команды.


Вторая особенность заключается в том, что всё общение объекта осуществляется только через процедуры моделирующие вход-выход модели (см. рис. 2), а не по стандартным принципам взаимодействия объектов, описание которых можно найти в книгах по объектно-ориентированному программированию, например в книгах «Библия Delphi» и «С++ Объектно-ориентированное программирование» [2, 6].


Третьей особенностью является, то, что хранилище объектов передаёт команду только одному объекту, далее объекты передают полученную команду друг другу.


Результаты эксперимента.


Для проверки работоспособности модуля и мульти-агентной системы были осуществлены два эксперимента. Первый должен был проверить возможности работы с однородными объектами задач, приведёнными в таблице 1.


Таблица 1.


Однородные объекты задач



Год



Месяц



Завершённость



Название задачи



Тип



Срочность



2011



04



Нет



Задача 1



Рабочая



1



2012



04



Да



Задача 2



Личная



3



2012



05



Нет



Задача 3



Рабочая



2



2012



07



Нет



Задача 4



Аспер.



1



2012



07



Нет



Задача 5



Аспер.



2



2012



08



Да



Задача 6



Рабочая



3



2012



08



Нет



Задача 7



Рабочая



1



2012



08



Нет



Задача 8



Аспер.



1



2012



08



Да



Задача 9



Личная



1



2012



08



Да



Задача 10



Аспер.



2


 


Суть эксперимента, в том, что в модуль посылались запросы на извлечение объектов с определёнными значениями свойств. В результате было сделано 20 запросов, их все можно разделить на группы:


·     1-ая группа — взятие объектов со всеми заполненными параметрами, было проведено 5 опытов с положительным результатом.


·     2-ая группа — взятие объектов с 1—3 незаполненными параметрами, было проведено 7 опытов с положительными результатами.


·    3-я группа — взятие объектов с 1—2 заполненными параметрами, было проведено 8 опытов с положительными результатами.


Второй эксперимент предполагал работу с неоднородными объектами, т. е. у объектов различается количество и название свойств. Для большего количества объектов к существующим объектам задач (таблица 1) были прибавлены новые приведённые в таблице 2.


Таблица 2.


Неоднородные объекты



Имя



Количество св-в.



Свойства



Книга



5



Листов: 203; Название: Что-то интересное; Автор: Человек; Издана: 2001; Издательство: где-то в Москве.



Книга



5



Листов: 880; Название: Библия Delphi; Автор: Михаил Флемов; Издана: 2007; Прочитана: Да.



Книга



6



Листов: 464; Название: C++ объектно-ориентированное программирование; Автор: В.В. Лаптев; Издана: 2008; Издательство: ПИТЕР; Прочитана: да.



Человек



5



Имя: Юра; Фамилия: Чижиков; Отчество: Владимирович; Возраст: 25; Специальность: Технолог.



Человек



5



Имя: Рома; Фамилия: Ёршиков; Отчество: Генадьевич; Возраст: 30; Специальность: автослесарь.



Сотрудник



4



ФИО: Сапыгин Александр Викторович; Возраст: 40; Должность: начальник отдела ИТ; З/п.: 40000.



Сотрудник



4



ФИО: Суркова Нона Влерьевна; Возраст: 35; Должность: экономист; З/п.: 20000.


.


Как видно из таблицы 2, были добавлены довольно сильно различающиеся по своей структуре объекты, которые также отличаются и от объектов, представленных в таблице 1.


К получившемуся пространству объектов было осуществлено около 15 запросов, все из которых были удачными, т.е. на каждый запрос возвращались объекты с указанными свойствами.


Эксперименты подтвердили возможность с помощью мульти-агентной системы извлекать из слабоструктурированных данных требуемую информацию. А также возможность осуществления запросов по любым параметрам объектов, которые необходимо найти.


Заключение.


В заключение можно сказать, что цель работы достигнута, как результат построена мульти-агентная система, предназначенная для извлечения из слабоструктурированных объектов необходимой информации.


Чтобы проверить мульти-агентную систему был написан программный модуль соответствующий условиям, поставленным в начале работы, и простая программа для работы с ним. Разработанный модуль позволяет создать слабоструктурированное пространство объектов отражающих сущности реального мира. Параметры заложенных сущностей могут полностью различаться друг от друга, т. е. могут различаться имена сущностей, название и количество их свойств (см. таблицы 1, 2). Из полученного слабоструктурированного пространства модуль может извлекать запрашиваемые пользователем объекты по значениям их свойств.


Далее планируется улучшить строение агентов путём добавления ассоциативных связей, в соответствии с которыми будут взаимодействовать агенты. Предполагается, что эти связи увеличат скорость получения необходимой информации из слабоструктурированного пространства объектов, что может существенно улучшить возможности работы с большим количеством объектов.


 


Список литературы:


1.Варшавский П.Р., Еремеев А.П. Моделирование рассуждений на основе прецедентов в интеллектуальных системах поддержки принятия решений. // Искусственный интеллект и принятие решений. 2009. № 5. — С. 45—57.


2.Лаптев В.В. C++ Объектно-ориентированное программирование: учебное пособие // СПб.: Питер, 2008, 464 с.


3.Роб П., Коронел К. Системы база данных: проектирование, реализация и управление. — 5-ое изд., перераб. и доп.: Перев. с англ. / СПб.: БХВ — Петербург, 2004. 1040 с. ил.


4.Солсо Р. Когнитивная психология — 6-е изд. / СПб.: Питер, 2006. 589 с.


5.Топчий А.В. Анализ и структурирование данных // Актуальные проблемы техники и технологии: докл. Всерос. Конф. Шахты, 2012.


6.Фленов М.Е. Библия Delphi // СПб.: БХВ-Петербург, 2007, 880 с.

Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.