Статья опубликована в рамках: XV Международной научно-практической конференции «Инновации в науке» (Россия, г. Новосибирск, 19 декабря 2012 г.)
Наука: Технические науки
Скачать книгу(-и): Сборник статей конференции
- Условия публикаций
- Все статьи конференции
дипломов
ОПРЕДЕЛЕНИЕ ЗАКОНОМЕРНОСТЕЙ РАСПРЕДЕЛЕНИЯ ЭНЕРГИИ ПО УЗКИМ ЧАСТОТНЫМ ИНТЕРВАЛАМ В ЗВУКАХ РУССКОЙ РЕЧИ
Анохина Дарья Витальевна
студент факультета Компьютерных наук и телекоммуникаций, Белгородский государственный национальный
исследовательский университет,
г. Белгород
Е-mail: 574150@od.bsu.edu.ru
Лихолоб Петр Георгиевич
ассистент кафедры информационно-телекоммуникационных систем и технологий, Белгородский государственный национальный исследовательский университет,
г. Белгород
Е-mail: Likholob@bsu.edu.ru
Щепилова Дина Васильевна
студент факультета Компьютерных наук и телекоммуникаций, Белгородский государственный национальный
исследовательский университет,
г. Белгород
Е-mail: 568142@bsu.edu.ru
DEFINITE PATTERN OF ENERGY DISTRIBUTION OVER A NARROW FREQUENCY INTERVAL IN THE SOUNDS OF RUSSIAN LANGUAGE
Darya Anokhina
student of Computer Science and Telecommunications faculty, National Research University Belgorod State University, Belgorod
Petr Likholob
assistant of Information technology systems and technologies department, National Research University Belgorod State University, Belgorod
Dina Schepilova
student of Computer Science and Telecommunications faculty, National Research University Belgorod State University, Belgorod
АННОТАЦИЯ
В работе анализируется количество узких частотных интервалов с заданной долей энергии.
ABSTRACT
In this article we analyze the number of narrow frequency intervals with a given fraction of energy.
Ключевые слова: ЦВЗ; доля энергии; частотный интервал; речевые данные; стеганография.
Keywords: watermarking; the fraction of energy; frequency interval; voice data; steganography.
В связи с высокой информатизацией общества проблема защиты информации является весьма актуальной. Масштабы и сферы применения таковы, что возникают проблемы обеспечения безопасности циркулирующей в ней информации. Конечно же, наиболее широко используемым и удобным способом обмена информации между людьми является речь. В виду этого возникает задача защиты такого рода информации. Существующие методы защиты информации преимущественно используются для аналоговых данных и нераспространенны для цифровых. Одним из направлений в решении данной проблемы выступают средства и методы, применяемые в цифровой стеганографии. Эффективность работы стегоалгоритмов зависит от выбора частотного интервала, куда будет внедряться дополнительная информация. От доли энергии, содержащейся в узком частотном интервале, зависит стойкость и скрытость помещаемой информации. На основе анализа и закономерностей распределения энергии по частотным интервалам отрезка речевых данных можно определить доступный объем внедряемой информации.
Для анализа речевые данные во временной области условно разбивают на окна равной длины (рисунок 1а).
Рисунок 1. Отрезок речевых данных: а) значения амплитуд во временной области; б) огибающая амплитуд трансформанты Фурье в частотной области
На рисунке 1, приняты обозначения — порядковый номер окна во временной области; — порядковый номер отсчета речевых данных; N — длительность в отсчетах анализируемого окна речевых данных ; — количество окон во временной области.
Распределение энергии по частотным интервалам для каждого звука русской речи разнообразно. Следовательно, количество частотных интервалов, которые можно использовать для внедрения ЦВЗ будет изменяться от окна к окну.
Для анализа распределения долей энергии по частотным интервалам удобно использовать методы, предлагаемые в [1]. Для этого частотную ось разбиваем на частотных интервалов равной ширины . Часть энергии , для каждого частотного интервала -окна речевых данных, может быть рассчитана с использованием выражения [1, с. 37]:
, (1)
где: — трансформанта Фурье;
— субполосная матрица, определяемая для каждого из R частотных интервалов с элементами вида:
,
(2)
где: , — границы r-ого частотного интервала, причем: , (рисунок 1б).
Для анализа речевых данных удобно рассматривать распределение долей энергии по узким частотным интервалам, рассчитанное для каждого окна речевых данных:
, (3)
где: — значение доли энергии сигнала;
— энергия анализируемого отрезка сигнала.
Для исследования использовались речевые данные, представляющие собой отрезки аудио-сигнала фраз русской речи, записанных с частотой дискретизации в 16-битовом представлении в режиме моно. В анализируемых фразах речевых данных выделялись отрезки во временной области, соответствующие звукам русской речи. Звуки (речевые данные) условно разделялись на равные окна длиной отсчетов, количество частотных интервалов отсчетов. Результаты вычислений долей энергии для 1000 отрезков каждого звука приведены в таблице 1.
Таблица 1.
Количество частотных интервалов, доступных для внедрения (в процентах), при N=160, r=40
Буквы |
Доли энергии, в которые возможно поместить ЦВЗ |
||||
1...10-1 |
10-1...10-2 |
10-2...10-3 |
10-3...10-4 |
10-4...10-5 |
|
а |
6,79 |
11,43 |
18,39 |
35,54 |
20,71 |
б |
5,54 |
6,96 |
16,07 |
42,50 |
28,93 |
в |
5,89 |
9,64 |
15,71 |
48,57 |
20,18 |
г |
5,00 |
11,43 |
26,61 |
45,18 |
11,79 |
д |
5,54 |
13,39 |
19,82 |
43,75 |
15,00 |
е |
6,61 |
6,43 |
10,89 |
46,07 |
29,82 |
ж |
6,79 |
20,89 |
33,75 |
33,75 |
4,29 |
з |
6,07 |
7,50 |
15,89 |
54,46 |
16,07 |
и |
6,79 |
7,32 |
16,07 |
50,71 |
17,32 |
й |
6,61 |
9,46 |
25,36 |
45,18 |
13,21 |
к |
7,86 |
34,64 |
28,57 |
21,43 |
7,32 |
л |
5,71 |
13,39 |
13,75 |
40,00 |
27,14 |
м |
4,64 |
6,96 |
15,71 |
56,96 |
15,71 |
н |
4,82 |
4,64 |
9,82 |
40,36 |
30,00 |
о |
8,93 |
12,68 |
10,54 |
24,46 |
37,14 |
п |
7,86 |
20,89 |
27,14 |
37,14 |
6,96 |
р |
6,07 |
23,75 |
33,75 |
28,04 |
8,21 |
с |
5,89 |
39,82 |
34,64 |
19,29 |
0,36 |
т |
5,54 |
43,93 |
36,96 |
10,36 |
3,04 |
у |
5,36 |
12,50 |
16,25 |
22,50 |
36,96 |
ф |
4,82 |
34,11 |
42,50 |
11,43 |
6,07 |
х |
8,04 |
24,82 |
26,07 |
35,00 |
6,07 |
ц |
3,93 |
53,39 |
32,50 |
9,46 |
0,71 |
ч |
5,18 |
41,25 |
42,32 |
10,71 |
0,54 |
ш |
5,36 |
30,71 |
36,25 |
23,21 |
4,46 |
щ |
6,61 |
33,39 |
44,46 |
14,29 |
0,89 |
ы |
6,61 |
11,79 |
18,21 |
39,64 |
22,50 |
э |
8,21 |
13,57 |
20,18 |
46,25 |
11,79 |
я |
7,32 |
6,79 |
20,18 |
55,00 |
10,54 |
Количество частотных интервалов выбрано из эмпирически полученного соотношения:
, (4)
где величина , что позволяет получить высокую избирательность при вычислении долей энергии в частотных интервалах.
Рисунок 2. Процентное содержание количества частотных интервалов с заданными долями энергии для букв русской речи
Как показывает анализ распределения долей энергии по частотным интервалам, звуки русской речи обладают рядом особенностей, которые можно использовать для внедрения ЦВЗ. Как видно из таблицы 1 все звуки отличаются концентрацией энергии. Следует заметить, что распределение долей энергии от окна к окну изменяется, имеет случайный характер и следующие особенности:
·большинство исследуемых звуков русской речи имеют максимальное значение количества узких частотных интервалов (шириной от 100 Гц до 200 Гц) доля энергии находиться в диапазоне 10-3...10-4. Большинство узких частотных интервалов звуков русской речи содержат долю энергии 10-3...10-4. При этом распределение энергии по частотным интервалам не зависит от длины окна N и количества R.
·в звуках, соответствующих буквам «к», «т», «с», «ц» — максимальное значение позиций для внедрения находится в частотных интервалах с долей энергии 10-1—10-2;
·в звуках, соответствующих буквам «ж», «р», «ш», «щ», — максимальное значение возможных находится в узких частотных интервалах с долей энергии 10-2—10-3;
·в звуках, соответствующих буквам «а», «е», «и», «й», «л», «м», «н», «п», «ы», «э», «я», — максимальное значение находится в узких частотных интервалах с долей энергии 10-3—10-4;
От изменения N и R зависят звуки ж, о, у, б. Кроме того, звук, соответствующий букве «ж» имеет распределении по узким частотным интервалам доля энергии которых составляет 10-2—10-3 и 10-3—10-4.
С увеличением длины окна N (как при r=32, так и при r=40 частотных интервалах) в звуках «о» и «у» максимальное значение находится в узких частотных интервалах с долей энергии 10-3—10-4 в интервал10-2—10-3.
С уменьшением длины окна N (как при r=32, так и при r=40 частотных интервалах) в звуке «б» максимальное значение находится в узких частотных интервалах с долей энергии и изменяется из интервала долей энерии10-3—10-4 и энергия перераспределяется в узкие частотные интервалы с долей 10-4—10-5.
Из полученных нами результатов можно сделать вывод, что внедрение информации целесообразно осуществлять в узкие частотные интервалы, содержащие малую долю энергии, так как интервалов с этой долей больше всего. Использование малоэнергетических узких частотных интервалов (доля энергии которых составляет 10-3…10-5 от энергии окна) для внедрения вызовет в данных минимальные искажения (изменения около 1 %).
Список литературы:
1.Жиляков Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным. — Белгород: Изд-во БелГУ, 2007. — 160 с.
дипломов
Оставить комментарий