Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LIX Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ГУМАНИТАРНЫЕ НАУКИ» (Россия, г. Новосибирск, 13 ноября 2017 г.)

Наука: Филология

Секция: Лингвистика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Зиновьева А.Ю. ОБЗОР ОНТОЛОГИЧЕСКИХ РЕСУРСОВ ПРЕДМЕТНОЙ ОБЛАСТИ «ТЕРРОРИЗМ» // Научное сообщество студентов XXI столетия. ГУМАНИТАРНЫЕ НАУКИ: сб. ст. по мат. LIX междунар. студ. науч.-практ. конф. № 11(59). URL: https://sibac.info/archive/guman/11(59).pdf (дата обращения: 26.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
Диплом Выбор редакционной коллегии

ОБЗОР ОНТОЛОГИЧЕСКИХ РЕСУРСОВ ПРЕДМЕТНОЙ ОБЛАСТИ «ТЕРРОРИЗМ»

Зиновьева Анастасия Юрьевна

магистрант, кафедра лингвистики и перевода, Южно-Уральский государственный университет (научно-исследовательский университет),

РФ, г. Челябинск

1. Введение

Феномен терроризма в современном мире известен почти каждому человеку и занимает значительную часть информационного пространства, в связи с чем террористическая деятельность является предметом интереса ученых различных профилей. С точки зрения прикладной лингвистики в первую очередь интересна структура террористической деятельности, которая может быть представлена в виде онтологии. Онтологии, в свою очередь, применяются для решения задач обработки естественного языка.

В настоящей работе представлен обзор онтологических ресурсов предметной области «терроризм», выполненный в рамках исследования по созданию подобного ресурса, нацеленного на использование в системе машинного перевода.

2. Онтологии в прикладной лингвистике

Онтологии в лингвистике представляют обширную область исследований. Перечислим в этом пункте тезисы, существенные для настоящей работы.

Согласно классическому определению Т. Грубера, онтология – это «явная спецификация общей концептуализации», где под концептуализацией понимается «абстрактная, упрощенная модель мира, создаваемая для определенных целей» [3, с. 199]. Онтологические ресурсы включают в себя концепты, свойства, отношения, аксиомы и экземпляры – индивидуальные сущности, являющиеся реализациями того или иного концепта [1].

Онтологии существенно различаются по ряду параметров, что позволяет исследователям классифицировать их по разным основаниям. Существенным для данной работы является разделение онтологий на онтологии верхнего уровня и онтологии предметной области [1]. Под онтологиями верхнего уровня понимаются ресурсы, в которых происходит первоначальное разделение действительности на категории; онтологии же предметной области содержат концепты и отношения между ними, характерные для определенной предметной области. Связь онтологии предметной области с онтологией верхнего уровня подразумевает, что первая должна поддерживать разделение мира на категории, принятое в последней.

Базовый алгоритм создания онтологии состоит из трех этапов [1]:

1) перечисление основных концептов,

2) поиск и установление отношений между концептами,

3) соотнесение набора экземпляров с концептами.

Выбор базовых концептов онтологии зависит от способа разработки онтологии. Исследователи выделяют три способа: нисходящий, восходящий и промежуточный [7]. Первый способ предполагает построение онтологии от наиболее универсальных концептов к более конкретным; второй, напротив, предполагает выделять универсальные концепты на основе индивидуальных сущностей. При промежуточном подходе сначала определяются ключевые концепты, после чего происходит их обобщение и детализация.

Онтологии широко применяются в машинном переводе, информационном поиске, вопросно-ответных системах и т.д. Используемые в таких задачах онтологии должны иметь формальное представление для «понимания» их компьютерной системой. Одним из наиболее часто используемых языков для формального представления онтологий является язык OWL [1].

3. Сравнительный анализ онтологических ресурсов

Целью настоящей работы является выявление особенностей онтологических ресурсов предметной области «терроризм» методом сравнительно-сопоставительного анализа существующих онтологий. В качестве материала использованы работы трех исследовательских коллективов, посвященные терроризму: онтология для интернет-портала Profiles in Terror (далее – онтология PiT) авторства ученых из университета Мэриленда [4, 5]; онтология AIT (Adversary–Intent–Target), разработанная специалистами в области искусственного интеллекта [6]; а также работа пермских лингвистов С.Л. Мишлановой и Е.А. Куприянычевой, посвященная изучению репрезентации концепта «терроризм» в новостных текстах [2].

При анализе работ задействованы следующие параметры:

  1. область применения онтологии,
  2. наличие связи с онтологией верхнего уровня,
  3. наличие экземпляров,
  4. способ построения онтологии и основные концепты,
  5. способ представления онтологии.

Кроме того, выделены проблемы, возникшие у разработчиков при создании онтологий.

Область применения онтологии

Онтология PiT разрабатывалась как основа для интернет-портала, содержащего информацию о террористах, террористических организациях и различных видах их взаимодействия. Авторы отмечают, что онтология представляет собой улучшенную версию импровизированной базы данных, которая стихийно строится в процессе расследования преступления. AIT, в свою очередь, предназначена для прогнозирования террористических актов на основе уже имеющихся в онтологии данных о террористических организациях, их намерениях и вооружении. Онтология С.Л. Мишлановой и Е.А. Куприянычевой разработана для выявления особенностей репрезентации концепта Терроризм в англоязычном дискурсе интернет-новостей.

Связь с онтологией верхнего уровня

Только об одной из проанализированных онтологий можно достоверно сказать, что она связана с онтологией верхнего уровня: AIT поддерживает разделение действительности на категории, принятое в BFO (Basic Formal Ontology). Согласно BFO, все в мире может быть разделено на материальные объекты, их качества и процессы, в которых они участвуют [6].

Наличие экземпляров

Экземпляры присутствуют во всех трех онтологиях, однако особенно важную роль они играют в PiT, поскольку значительная часть онтологии покрывает именно взаимодействие этих экземпляров. Роль экземпляров в AIT менее существенна, поскольку отдельные теракты, тем более произошедшие в отдаленном прошлом, как считают авторы, не могут помочь в решении сегодняшних проблем.

Способ построения онтологии и основные концепты

Учитывая ту важную роль, которая отводится экземплярам в PiT, можно сделать вывод, что построение онтологии идет снизу вверх. Это подтверждают и сами разработчики [5]. В качестве основы для разработки онтологии выступают базы данных, содержащие информацию о террористических актах и их исполнителях. Разумеется, этой информации недостаточно для полномасштабного описания сети террористов, поэтому к таким очевидным концептам, как Событие, к которому относится собственно террористический акт, Человек и Организация, разработчики добавляют концепты, описывающие гражданское состояние террориста, его контакты с другими людьми, различные способы секретной коммуникации и так далее. PiT является довольно обширной онтологией: в ней содержится 70 концептов и 173 свойства.

Онтология С.Л. Мишлановой и Е.А. Куприянычевой основана на нисходящем подходе. Верхним и основным концептом онтологии является Терроризм, который затем подразделяется на концепты, описывающие субъект, объект, результаты и последствия террористической деятельности. Авторы также упоминают оружие как средство террористической деятельности, но не рассматривают его как отдельный концепт. Выделение концептов предметной области происходит на основе анализа словарных дефиниций и текстов российских законов.

Создатели AIT используют промежуточный подход к построению онтологии. Разработка ресурса начинается с моделирующего указания –предложения на естественном языке: «Террористический акт происходит, когда злоумышленник, имея намерение и возможности, использует оружие против цели» [6]. Все ключевые слова этого предложения анализируются экспертами предметной области под руководством специалиста в области представления знаний. Анализ слова «злоумышленник» приводит к выводу о существовании концепта Террористическая Организация и, следовательно, о необходимости создать комплементарный ему концепт нетеррористической организации. С помощью такого анализа определяются базовые термины предметной области и отношения между ними. Онтология поддерживает всего 11 основных отношений и еще четыре обратных, но при этом содержит множество концептов, поскольку полученные при помощи моделирующего указания концепты далее подвергаются разделению с высокой степенью детализации.

Способ представления онтологии

Онтология PiT написана на языке OWL и реализована в виде интерактивного портала семантической паутины, где пользователь может взаимодействовать с сетью концептов, представленной в виде графа. Ресурс поддерживает не только текстовое содержимое, но также, например, фотографии и видеоролики, что делает его более наглядным и, соответственно, увеличивает его объяснительную силу. AIT также написана на языке OWL, однако не имеет интерактивной оболочки, поскольку недостаточно проработана для введения в эксплуатацию. По замыслу авторов, AIT должна стать частью сложной системы – базовой онтологии терроризма BOOT (Basic Ontology Of Terrorism), с которой могли бы работать специалисты в различных сферах. Онтология С.Л. Мишлановой и Е.А. Куприянычевой не имеет формального представления.

Проблемы при разработке онтологий

Разработчики AIT отмечают, что разделение мира на категории, принятое в BFO, не в полной мере удовлетворяет их потребностям. Так, BFO позиционируется как ресурс, максимально объективно отражающий объекты реального мира; соответственно, в ней отсутствует инструментарий, позволяющий описывать субъективные мнения. При этом одним из основных концептов онтологии AIT является Намерение, абстрактное субъективное понятие. Разработчики вышли из положения, определив этот концепт в категорию качеств.

Следует отметить, что для ряда проблем, связанных с представлением террористической деятельности, в онтологии найдены оригинальные решения. Так, согласно моделирующему указанию, некий злоумышленник, то есть Террористическая Организация, имеет Намерение совершить террористический акт. Соответственно, можно предположить, что указанные концепты должны быть связаны отношением иметь намерение. Однако авторы отмечают, что различные организации могут иметь разные намерения, будь то свержение государственной власти или борьба с неверными, поэтому это отношение должно связывать конкретные организации или даже конкретных лиц с конкретными намерениями.

Еще одна ловушка, в которую может попасть разработчик онтологии терроризма, по мнению авторов AIT, заключается в отнесении отдельных террористов к организациям в качестве их экземпляров. Очевидно, что отдельные люди не могут быть экземплярами организаций, поскольку не наследуют всех их признаков; они являются экземплярами класса Человек. Тем не менее, нельзя заявить о полной независимости организации и человека друг от друга: так, при вступлении в организацию человека, который обладает некоторыми компетенциями, данная организация также начинает обладать этими компетенциями. Следовательно, наиболее логичным решением этой проблемы является введение в онтологию отношения быть членом, что и сделали разработчики AIT.

Разработчики PiT касаются в своей работе несколько иных проблем. Поскольку портал, основой которого является онтология, предназначен в первую очередь для расследования преступлений, одной из ключевых его функций должен быть поиск по содержимому онтологии. Существующие поисковые механизмы, основанные на обработке естественного языка, представляются авторам недостаточно эффективными для расследования, потому что работают путем сопоставления символов и выдают множество нерелевантных результатов. Следовательно, для таких механизмов имена многих террористов – выходцев с Ближнего Востока представляют серьезную проблему, так как ближневосточные имена могут иметь несколько вариантов передачи знаками других письменностей. Портал семантической паутины, в свою очередь, может быть настроен таким образом, чтобы имена «Усама бин Ладен» и «Осама бен Ладен» рассматривались как обозначения одного экземпляра онтологии.

Еще одна проблема, выделяемая авторами PiT, заключается в онтологическом представлении терактов, которые состоят из нескольких атак в разных местах. Разумеется, можно было бы описать каждую атаку отдельно, отметив их как связанные друг с другом, однако в таком случае аналитику не удалось бы получить полной картины произошедшего; описание же всех четырех атак в рамках одного события сделало бы невозможным отслеживание передвижений каждого исполнителя. Проблема была решена по «принципу матрешки»: для описания терактов был создан специальный слот, значением которого мог являться только концепт, относящийся к той же самой категории. Таким образом, появилась возможность создавать так называемые вложенные концепты. Этот принцип успешно применялся авторами для решения и других схожих проблем.

4. Заключение

На основании проведенного сравнительно-сопоставительного анализа онтологических ресурсов можно сделать вывод, что выбор предметной области «терроризм» практически не влияет на такие аспекты онтологии, как ее связь с онтологией верхнего уровня, наличие экземпляров, способ построения и представления онтологии. Определяющей в данном случае является цель создания онтологии и область ее будущего применения, а также предпочтения разработчика. При этом, от предметной области зависит, очевидно, набор основных концептов, свойств и отношений; однако этот набор также может не совпадать в разных онтологиях, поскольку каждый разработчик имеет свое собственное видение мира. Кроме того, цель разработки также может иметь здесь определяющее значение.

В процессе разработки онтологии могут возникнуть различные проблемы: например, может оказаться так, что онтология верхнего уровня, с которой связана разрабатываемая онтология предметной области, не имеет необходимого инструментария для реализации тех или иных идей разработчика. Следовательно, приступая к созданию онтологии терроризма, необходимо четко представлять себе область ее будущего применения.

 

Список литературы:

  1. Митрофанова О.А., Константинова Н.С. Онтологии как системы хранения знаний [Электронный ресурс]. – 2015. – URL: https://goo.gl/9nBHXW (дата обращения: 31.10.2016).
  2. Мишланова С.Л., Куприянычева Е.А. Особенности репрезентации концепта терроризм в англоязычном дискурсе новостей интернет-ресурсов // Филологические заметки. – 2012. – С. 265–276.
  3. Gruber T.R. A Translation Approach to Portable Ontology Specifications // Knowledge Acquisition. – Vol. 5 (2). – 1993. – P. 199–220.
  4. Mahesh K., Nirenburg S., Beale S. Toward Full-Text Ontology-Based Word-Sense Disambiguation // Recent Advances in Natural Language Processing. – Vol. 2. – 2000. – P. 131–142.
  5. Mannes A., Golbeck J. Building a Terrorism Ontology [Электронный ресурс] // ISWC Workshop on Ontology Patterns for the Semantic Web. – Vol. 36. – 2005. – URL: http://goo.gl/WXeVVv (дата обращения: 9.07.2017).
  6. Mannes A., Golbeck J. Ontology Building: A Terrorism Specialist’s Perspective // Aerospace Conference. – 2007. – P. 1–5.
  7. Turner M., Turner J., Weinberg D. Simple Ontology for the Analysis of Terrorist Attacks [Электронный ресурс]. – 2011. – URL: https://goo.gl/tqyTRG (дата обращения: 1.10.2017).
  8. Uschold M., Gruninger M. Ontologies: Principles, Methods and Applications // Knowledge Engineering Review. – Vol. 11 (2). – 1996. – 63 p.
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
Диплом Выбор редакционной коллегии

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.