Статья опубликована в рамках: Научного журнала «Студенческий» № 10(30)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6
СТРУКТУРА ДАННЫХ СРЕДЫ УПРАВЛЕНИЯ ПРОГРАММНЫМИ МОДУЛЯМИ ДЛЯ РЕШЕНИЯ КРИПТОГРАФИЧЕСКИХ ЗАДАЧ
Аннотация: в статье приведена структура данных среды управления программными модулями для решения криптографических задач. Представлена классификация данных и приведен пример их организации.
Ключевые слова: метод проб и ошибок, структура данных, дерево решений, лес решений.
Для решения криптографических задач используются различные методы. Например, такие как методы частотного упорядочивания, метод аппроксимации условных распределений биграмм текста, метод детерминированной идентификации символов текста и другие [1-5]. Во многих случаях при поиске решения эти методы могут комбинироваться различными способами. Таким образом, общим методом при решении криптографических задач можно считать метод проб и ошибок.
Результат применения данного метода – дерево решений. В поисках верного решения любой метод криптоанализа может быть применен к любому узлу дерева. Поэтому метод проб и ошибок требует хранения всего дерева решения, что определяет особенность среды, в которой осуществляются функции отдельных криптографических методов и управление ими.
Такая среда должна включать в себя следующие типы данных:
- Множество текстов
- Множество выборок данных
- Множество эталонных значений
- Лес решений
- Множество статистических данных
Для подготовки данных необходимо:
- Определить структуры всех входных, выходных и вспомогательных файлов.
- Выделить глобальные переменные и определить способы их хранения.
- Сформировать базу данных с четкой файловой структурой.
Все входные и выходные файлы должны иметь стандартизованное название, так как методы решения могут применяться к разным фрагментам выборок данных. Данные в каждом файле должны иметь циклическую структуру. Первым символом в таких файлах является число, обозначающее количество фрагментов цикла. Затем идут стандартизованные блоки входной или выходной информации.
Общей формой представления для всех типов данных является их организация в виде текстовых файлов, а общей формой хранения – их организация на файловом сервере. Это обеспечивает открытый доступ функциональных модулей к данным вычислительной среды.
На рис.1 приведен пример входных данных в виде униграмм. Стандартизованное название файла - inU. Первое число (48) обозначает количество элементов цикла. Далее идут пронумерованные фрагменты, содержащие частотную характеристику соответствующих отрывков текста. В каждом фрагменте указывается мощность алфавита, количество пробелов, сам алфавит и количество каждого символа в тексте соответственно. Алфавит упорядочен по частоте встречаемости символов.
Рисунок 1. Структура файла униграмм
На рис. 2 приведен пример файла решений. Стандартизованное название файла – ouR. Первое число (48) обозначает количество фрагментов текстов, к которым были применены методы идентификации символов. Второе число (5) является количественным показателем узлов в деревьях, не считая корневого. Далее идут пронумерованные фрагменты – деревья решений для выборок данных. В каждом дереве указывается все имеющиеся решения, их индекс, индекс предыдущего узла и метод, которым было получено решение.
Рисунок 2. Структура файла решений
Общее управление файлами среды осуществляется с помощью файлов-таблиц базы данных. Они описывают свойства файлов среды, их структуру и другие необходимые атрибуты. Файлы-таблицы так же являются текстовыми и могут быть легко импортированы в любую реляционную БД. Средствами соответствующей СУБД осуществляется выборка необходимых файлов данных.
Для управления данными файлами был разработан интерфейс Tbase на базе Microsoft Access. Данный интерфейс подгружает в себя файлы-таблицы управления файлами данных вычислительной среды, а по завершению работы осуществляет их выгрузку на файловый сервер. Данный интерфейс не хранит в себе непосредственно файлы, содержащие тексты и их фрагменты, а также различные их характеристики. Tbase может осуществляет доступ к входным данным: запускает файл в текстовом редакторе; добавлять или удалять входные данные. Также Tbase позволяет осуществлять административные функции, такие как добавление/удаление пользователей и т.д.
Рисунок 3. Интерфейс Tbase
Рисунок 4. Доступ к данным среды через Tbase
Список литературы:
- Chen Jian, Rosenthal Jeffrey S. Decrypting classical cipher text using Markov chain Monte Carlo // Statistics and Computing. 2011. vol. 22. no. 2. pp. 397—413.
- Jakobsen T. A fast Method for Cryptanalysis of Subsittution Ciphers // Cryptologia. vol.19. no 3. 1995. pp. 265-274.
- Jason Brownbridge Decrypting Substitution Ciphers with Genetic Algorithms // Department of Computer Science. University of Cape Town. 2007. p.12
- Бабаш А.В., Баранова Е.К. Криптографические методы и средства информационной безопасности // М. 2010.
- Котов Ю.А. Детерминированная идентификация буквенных биграмм в русскоязычном тексте // Труды СПИИРАН. 2016. Вып. 44. C. 181-197.
Оставить комментарий