Статья опубликована в рамках: XV Международной научно-практической конференции «Экспериментальные и теоретические исследования в современной науке» (Россия, г. Новосибирск, 28 марта 2018 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Стефанова И.А., Заболотов В.А. АППРОКСИМАЦИЯ ПОРОГА РАЗЛИЧИМОСТИ ЧАСТОТЫ ТОНА // Экспериментальные и теоретические исследования в современной науке: сб. ст. по матер. XV междунар. науч.-практ. конф. № 6(15). – Новосибирск: СибАК, 2018. – С. 11-15.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

АППРОКСИМАЦИЯ ПОРОГА РАЗЛИЧИМОСТИ ЧАСТОТЫ ТОНА

Стефанова Ирина Алексеевна

канд. тех. наук, доц. Поволжского государственного университета телекоммуникаций и информатики,

РФ, г. Самара

Заболотов Владимир Александрович

магистрант Поволжского государственного университета телекоммуникаций и информатики,

РФ, г. Самара

APPROXIMATION OF FREQUENCY- DIFFERENCE THRESHOLD S FOR TONES

Irina Stefanova

PhD (Science), assistant professor of Volga Region State University of Telecommunications and Informatics,

Russia, Samara

Vladimir Zabolotov

MSc student of Volga Region State University of Telecommunications and

Informatics,

Russia, Samara

АННОТАЦИЯ

Вопросы эффективности систем сжатия аудиоданных являются весьма актуальными в наше время. В статье рассматривается математическая модель одного из свойств слуха – минимально ощущаемая девиация тонов различной частоты, позволяющая при ее использовании повысить эффективность систем сжатия аудиоданных.

ABSTRACT

The issues of effective audio data compression are very relevant nowadays. The article deals with the mathematical model of one of the hearing properties – the minimal perceived deviation of the tones with different frequencies, which allows to increase the efficiency of audio data compression systems.

Ключевые слова: сжатие аудиоданных; психоакустические свойства слуха; цифровая обработка сигналов.

Keywords: compression of audio data, psychoacoustic properties of hearing, digital signal processing.

Бурный рост использования Internet и мобильных устройств в настоящий момент способствуют активизации исследований, направленных на сокращения избыточности и сжатия данных связанных с хранением, переработкой, и передачей огромных потоков информации в цифровой форме. Как правило, большую часть трафика Internet занимает просмотр и прослушивание мультимедиа. Поэтому исследования по повышению эффективности методов сжатия аудиоданных продолжают оставаться весьма актуальными. В исследованиях большое внимание уделяется вопросам развития методов сжатия аудиоданных, основанных на использовании психоакустических свойств слуха человека. При этом сжатие звуковых сигналов производится не во временной, а в частотной области, что позволяет использовать такие основные свойства слухового анализатора как частотное группообразование, абсолютный и болевой пороги слышимости, частотную избирательность слуха [3]. Основополагающими в области исследования свойств человеческого анализатора, являются работы авторов Цвиккр Э. и Фельдкеллер Р. Они исследовали большое количество свойств слуха человека и представили рекомендации по их применению.

Несмотря на большое число созданных и распространенных алгоритмов сжатия, ряд из них имеют недостатки. К их числу можно отнести применение далеко не всех известных в психоакустике свойств слуха человека, либо использование их упрощенных математических моделей [2, с. 189].

С этой точки зрения наиболее эффективно рассматривать методы сжатия с применением других, менее изученных, свойств слуха человека. Раскрытие представления о свойствах слуха человека дают минимально ощущаемых изменения частоты тонов и шумов. Оказывается, что частотная избирательность слуха весьма высока и, кроме того, зависит от частоты и уровня звукового давления [3, с. 76].

Большинство тонов, с которыми приходится иметь дело при цифровой обработке не стационарны – их частота и амплитуда меняются во времени. Чтобы судить об этих изменениях, надо знать, каковы те минимальные изменения частоты, которые ощущаются слухом человека. Мгновенные изменения частоты воспринимаются как щелчки и их следует исключить, будем рассматривать только частотно модулируемые тоны. При этом вопрос о минимально ощущаемых слухом изменениях частоты тонов можно свести к вопросу о минимально воспринимаемой девиации Df при частотной модуляции, осуществляемой по синусоидальному закону.

На рис. 1 [3, с. 78] показаны усредненные результаты измерений минимально ощущаемой девиации Df тона в функции его частоты при интенсивности тона (уровне звукового давления) L=70 дБ и частоте модуляции 4 Гц как одной из частот, наилучшим образом ощущаемых слухом. В общем случае ход этой кривой зависит от частоты модуляции и интенсивности тона, причем при изменении этих параметров относительно указанных значений минимально ощущаемая девиация частоты только увеличивается. В области частот меньше 500 Гц, пороговая девиация почти не зависит от модулирующей частоты. Здесь величина пороговой девиации составляет Df =1.8 Гц. На частотах выше 500 Гц пороговая девиация возрастает почти пропорциональна частоте, при этом увеличивается крутизна кривой, изображенной на рис. 1.

С точки зрения производительности системы сжатия звуковых сигналов, кривая на рис. 1 соответствует наихудшему случаю, обеспечивая тем самым оценку девиации Df, пригодную для любых звуковых сигналов, полоса частот которых не выходит за пределы 16000 Гц. Кривая разделяет области слышимых и неслышимых колебаний высоты тонов.

Для дальнейшего практического применения рассмотренного свойства в целях эффективного сжатия необходимо получить математическую зависимость минимально ощущаемой девиации тона Df в функции его частоты.

Рисунок 1. Частотная зависимость минимально ощущаемой девиации тона

Для этого воспользуемся одним из методов регрессионного анализа [1], заложенного в математическом пакете Mathcad 14 (Pro) – линейной регрессии общего вида:

DF(f, K₁, K₂, …, K_n) = K₁×F₁(f) + K₂×F₂(f) + … + K_n×F_n(f), (1)

где: F₁(f), F₂(f), ..., F_n (f) – некоторые функции (возможно и нелинейные);

K₁, K₂, …, K_n – коэффициенты, соответствующие этим функциям.

При этом в качестве критерия точности приближения DF (f, К₁, К₂, …, К_n) к экспериментальным данным используется коэффициент детерминации:

, (2)

где: L – общее число исследуемых точек данных;

– соответственно, расчётное и экспериментальное значения данных;

– усреднённое по L значение экспериментальных данных.

Причем чем ближе коэффициент детерминации R² к единице, тем точнее приближение. Необходимое выражение минимально ощущаемой девиации df тона в функции его частоты f_T с высокой степенью точности (R²® 1) описывается функцией:

, Гц. (3)

Аппроксимирующая функция и наиболее характерные точки исходной зависимости показаны на рис. 2. Как видно, форма аппроксимирующей функции практически точно повторяет форму исходной зависимости.

Рисунок 2. Аппроксимирующая функция df(f_т)

В ходе проделанной работы удалось получить аналитическое описание для исследуемой кривой, которое может быть использовано при построении цифровых кодеков с цифровой компрессией аудиоданных.

Список литературы:

Воскобойников Ю. Регрессионный анализ данных в пакете Mathcad. М: Лань, 2011 – 224 с.
Ковалгин Ю.А., Вологдин Э.И. Цифровая обработка звуковых сигналов. – СПб.: КОРОНА-принт, 2004 – 240 с.
Цвикер Э., Фельдкеллер Р. Ухо как приемник информации / пер. с немецкого, под ред. Б.Г. Белкин. М.: Связь, 1971 – 255 с.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

АППРОКСИМАЦИЯ ПОРОГА РАЗЛИЧИМОСТИ ЧАСТОТЫ ТОНА

Оставить комментарий