О некоторых соотношениях между графическими изображениями и звуковыми сигналами | Прикладная дискретная математика. Приложение. 2009. № 1.

О некоторых соотношениях между графическими изображениями и звуковыми сигналами

Various chains of transformations which are possible between graphic imagesand the real functions are considered. Thus there is an opportunity of application andcomparison of methods for coding, compression, etc. to the same information in variousforms of its representation.

On some relations between graphic images and sounds.pdf Революционное развитие цифровых и информационных технологий постоянно стимулируетпроведение новых научных и прикладных исследований во многих областях,связанных с различными формами представления и обработки информации. Информационноевзаимодействие в виде передачи графических образов и звуковых волн являетсяодним из наиболее распространенных и привычных. При этом для восприятияизображений и звуковых волн человек использует разные органы чувств со своимивозможностями и механизмами.В силу определенных причин развитие математических и прикладных вопросовобработки изображений и звуковых сигналов осуществлялось в значительной степенинезависимо и по параллельным направлениям. Вместе с тем между этими объектамиможно определить целый ряд взаимосвязей, которые могут представлять интерес длядальнейших исследований.Математические вопросы, связанные с преобразованием звуковой волны в графическоеизображение и обратно, достаточно хорошо изучены [1-3]. В цифровом видеэто можно представить следующей цепочкой равенств:f(t) АД" f [n ■ T1 ] = f[n] ДДФ Sf[k] ОД" Ф f[n] = f[n ■ T2] ЦДП f(t), (1)где АЦП / ЦАП - аналогово-цифровое и цифро-аналоговое преобразования; ДПФ /ОДПФ - прямое и обратное дискретное преобразование Фурье; Ti = 1/FDi, i = 1, 2 -частота дискретизации, которая может изменяться в процессе преобразований.Функции f (t), /(t ) в (1) являются действительными и имеют финитный спектр [1].Поэтому действительная часть комплекснозначной функции {Sf [k]} четна, а мнимая -нечетна. В качестве графического изображения функции f (t) принято рассматриватьизменения во времени модуля спектральной функции {| Sf [k] |} . Для речевых сигналовподобные изображения иногда называют «видимой речью», а в общем случае мы имеемизображение спектрограммы временной функции f(t) .Звуковые редакторы (ЗР) [4] позволяют проводить построение и отображение в широкомцветовом диапазоне спектрограмм для различных входных сигналов. Но возможностейграфического редактора, т. е. редактирования изображений-спектрограммзвуковые редакторы не предоставляют. Этому факту есть ряд причин.1) Все преобразования ЗР, как правило, выполняют во временной области, а спектрограммаслужит для рассмотрениятех или иных свойств сигнала и результатовпреобразований в частотной области.2) Осуществить корректный синтез временной функции /(t ) после произвольных преобразованийспектрограммы {|Sf [k] |} без дополнительных ограничений на функциюf (t) практически невозможно, так как теряется информация о фазе функции{Sf [k]}.Подчеркнем, что для криптографической защиты речевых сигналов [5] предлагаетсяиспользовать различные частотно-временные преобразования [6, 7], которыесущественным образом учитывают особенности речевого сигнала.В предположении о минимальности фазы функции f (t) модуль и фаза {Sf [k]} связаныпреобразованием Гильберта [2, 3], модуль {|Sf[k]|} с точностью до скалярногомножителя определяет фазу {Sf [k]} и наоборот. В этом случае можно реализоватьразличные преобразования со спектрограммой на уровне графического файла {|Sf [k]|}и однозначно восстановить функцию /(t):f (t) - { | S f [k ]| }- f(t). (2)Ряд программ («Лазурь», Coagula и др. [8]) позволяют осуществлять преобразованиязвуковых сигналов на уровне их графических образов, но пока все эти программныепродукты далеки от совершенства и не имеют широкого распространения.При рассмотрении возможностей подобных программ вводится термин «рисованиезвуком», который отражает преобразования звука и графики с точки зрения выражений(1), (2). Но можно считать «первичным» именно графическое изображение. Вэтом случае цепочка преобразований примет видGmixNi = |Gg [k]| ОДПФ g[n] ^ {|GGg [k]|} = Gm2xN2 , (3)где GmiXNi = |Gg [k]| - матрица, которая соответствует произвольному графическомуизображению в пиксельном формате [11] и интерпретируется как спектр мощностинекоторой действительной функции g(t). При этом необходимо выполнить только требованияк конечности спектра функции g(t) (см. выше).Переход от спектра мощности {| Gg [k] |} к временной функции можно осуществлятьразными способами, например считать мнимую часть спектра равной нулю, равнойпо мощности действительной части и т. п. Разработка удобных инструментальныхсредств, реализующих выражение (3) для различных графических форматов, позволитпровести исследования по целому ряду перспективных направлений.1) Сравнить по различным параметрам возможности восприятия информации зрительнойи слуховой системами человека [9, 10].2) Сравнить методы сжатия информации [11], представленной в форме изображенияи звуковой волны.3) Исследовать возможности передачи графической информации посредством звуковойволны.4) Рассмотреть возможные сочетания различных методов защиты информации награфическом и волновом уровнях представления.Критерием корректности предлагаемых преобразований должна служить возможностькак можно более точного восстановления исходного изображения.

Ключевые слова

Авторы

ФИООрганизацияДополнительноE-mail
Гришин Анатолий МихайловичИнститут криптографии, связи и информатики, г. Москвастарший научный сотрудник, кандидат технических наук, доцентav123470@comtv.ru
Всего: 1

Ссылки

Оппенгейм А. В., Шафер Р. В. Цифровая обработка сигналов. М.: Техносфера, 2006.
Рабинер Л. Р., Шафер Р. В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981.
Сергиенко А.Б. Цифровая обработка сигналов. СПб.: Питер, 2003.
Петелин Р., Петелин Ю. Cool Edit Pro 2. Секреты мастерства. БХВ-Петербург, 2004.
Алфёров А. П., Зубов А. Ю., Кузьмин А. С., Черемушкин А. В. Основы криптографии. М.: Гелиос АРВ, 2001.
Закрытие телефонных переговоров. ВЕБ форум по безопасности / / http://www.sec.ru/
Кравченко В. Б. Защита речевой информации в каналах связи / / Специальная техника. 1999. №4. С. 2-9; 1999. №5. С. 2-11.
Материалы сайта Websound.ru
Грегори Р. Разумный глаз. М., 2003.
Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. под общей ред. Б. Г. Белкина М.: Связь, 1971.
Сэломон Д. Сжатие данных, изображений и звука. М.: Техносфера, 2004.
 О некоторых соотношениях между графическими изображениями и звуковыми сигналами | Прикладная дискретная математика. Приложение. 2009. № 1.

О некоторых соотношениях между графическими изображениями и звуковыми сигналами | Прикладная дискретная математика. Приложение. 2009. № 1.