Консультационный центр MATLAB: Wavelet Toolbox, Wavelet-Музыка. К.А.Алексеев

Семинары

Лекции

Лицензирование

Разработка

Форум

Регистрация

Matlab

Toolboxes

Simulink

Blocksets

Femlab

3rd-Party Products

Полезное

Раздел "Обработка сигналов и изображений\Wavelet Toolbox"

К.А.Алексеев "Wavelet-Музыка"

В который раз я слушал запись “Messa di Requiem” Джузеппе Верди, однако, вместо того, чтобы наслаждаться этим потрясающим произведением и филигранной трактовкой фон Шолти, вместо того, чтобы учиться технике филирования звука, его формированию, контрастированию на примере пения блестящих Джоан Сазерленд, Лучано Паваротти и Мерелин Хорн, я не знал, как избавиться от одной мысли, буквально изводившей меня. Эта мысль никогда раньше не приходила мне в голову, несмотря на то, что я, можно сказать, не расстаюсь с музыкой.

Мысль, не дававшая покоя, была мыслью о полноте музыкальной нотации как базиса, мыслью о возможности ненотационной записи музыки. Конечно, нотационная форма является весьма удобной, поскольку с ее помощью, а также с помощью некоторых других специальных знаков (например, бемоля, диеза, знаков мелизмов) достаточно просто записать любое произведение, достаточно просто его прочесть. Однако внушительность итогового количества страниц с записью даже небольшой композиции, не говоря о целой опере, издаваемой в виде весьма толстых талмудов, заставила меня задуматься о качестве нотационного базиса.

В древности, существовало множество форм записи музыки: греческая форма, крюковые формы знаменных, демественных и др. распевов, которые впоследствии были заменены набором всего семи делений октавы, рассматриваемых посейчас как наиболее совершенная форма записи. Недавно стала возможной запись музыкального произведения как аудиосигнала в виде последовательности единиц и нулей, упакованных в файл на некотором носителе. Так или иначе, запись музыки осуществляется посредством разложения звукоряда по некоторым векторам (или функциям), образующим базисную систему.

1. Математическая нотация записи музыки

1.1. Ортогональные и неортогональные базисы записи

Предположим простоты ради, что исходный сигнал , например, пение, представляет собой ноту, звучащую в течение некоторого интервала времени: . С целью записи данного сигнала введем в следующую ортогональную базисную систему:

Поскольку любой вектор может быть представлен в виде единственного и только единственного линейного разложения по базисным векторам пространства, запишем исходный сигнал в виде:

где =1.

Сравним результат разложения сигнала по ортам пространственных осей с разложением сигнала, использующим нотационную форму записи. В музыке исходный сигнал может быть представлен либо целой нотой, либо двумя “половинками”, либо четырьмя четвертыми, либо восемью восьмыми, либо шестнадцатью шестнадцатыми, либо тридцатью двумя тридцать вторыми нотами, т.е. шестью способами!

В теории линейной алгебры можно указать такой базис, в котором исходный сигнал и один из базисных векторов пространства равны, т.е. исходный сигнал может быть заменен одним лишь базисным вектором. (Понятно, такое представление все же является линейной комбинацией, в котором коэффициенты при других векторах равны 0). Данный базис представляет собой базис Хаара:

полученный посредством трансляции и дилатации вектора [1]. В базисе Хаара запись исходного сигнала осуществляется в виде последовательности средних значений отсчетов сигнала, образующих сжатую, более грубую версию сигнала, а также коэффициентов детализации, несущих информацию о “тонкой” структуре сигнала, рассчитываемых по формулам:

т.е. в виде последовательности {1,0,0,0}.

1.2. Фурье-нотация

Не отвлекаясь более на теоретические подробности записи, представим себя на месте композитора, имеющего в своем распоряжении некоторую музыкальную тему – мелодию. Положим также, что в нашем распоряжении имеется что-то вроде libretto, и конечная цель нашего творчества есть создание небольшой четырехголосной композиции (например, concertino) для смешанного хора: басов, теноров, альтов и сопрано. При этом для записи нашей композиции вместо непосредственной – нотационной – формы, каковой пользуются все без исключения музыканты, воспользуемся способами математической “нотации” произведения.

Классическим способом анализа и записи музыкальных произведений является способ разложения в ряд Фурье [2, 3]:

где - произведение, исполняемое хором, - амплитуда (громкость) ноты, - частота -той гармоники (звучащего тона), - число нот в произведении.

Из формулы видно, что подобная форма записи произведения не обеспечивает дирижера и вокалистов хора (равно как скрипачей, виолончелистов, кларнетистов и др. музыкантов оркестра в случае исполнения симфонического произведения) точными сведениями относительно того, в каком такте и начиная с какой его доли необходимо пропеть ту или иную фразу, ни даже представлениями о том, какова структура самой фразы (например, педаль или колоратурный пассаж). Вспомним при этом, что, например, невмы знаменного распева не обеспечивали монастырских певчих лишь информацией о точной высоте звука, давая необходимые сведения о его длительности.

Недостаток такой “Фурье-нотации” заключается, как известно, в потребности полной периодичности звучания хора, что представляется практически невозможным.

Одним из возможных способов повышения качества “Фурье-нотации” может служить способ, основанный на использовании сегментов данных (окон). Воспользуемся в качестве таких сегментов естественным делением музыкального произведения на такты, – другими словами, будем считать каждый такт одним сегментом данных. Здесь необходимо подчеркнуть, что не существует никаких ограничений в принятии 2, 3, 4 и более тактов за один сегмент данных, однако, представляется очевидным факт ухудшения качества нотации при увеличении размера сегмента.

Аналогично предыдущему случаю, разложим каждый такт композиции в ряд Фурье, после чего получим:

где - Фурье-нотация каждого такта, - число нот в каждом такте.

Совокупность Фурье-нотаций, соответствующих каждому такту музыкального произведения, по-видимому, обеспечивает чуть более ясную картину звукового содержания такта в отличие от предыдущего случая, однако остается по-прежнему недостаточно информативной системой записи. Во время исполнения сегментированное таким образом произведение представится слушателю как последовательность полифонических аккордов.

1.3. Wavelet-нотация

Наиболее близкая, как можно убедиться далее, к истинной нотационной форме математическая запись произведения основана на использовании базиса, образованного wavelet-функциями.

Wavelet-функции представляют собой функции, обладающие компактным носителем, обеспечивающим их локализацию во временной области, а также набором моментов, обеспечивающих их локализацию в частотной области. При этом одним из замечательных свойств классических wavelet-функций является возможность их построения путем трансляции и дилатации какой-либо одной, материнской, wavelet-функции [3, 4]. Необходимо подчеркнуть, что операции трансляции и дилатации обеспечивают сходство классических wavelet-функций с нотационной формой записи, указывая как на длительности нот каждого такта, так и на их “высоту”. Воспользуемся упомянутыми свойствами wavelet-функций для записи партитуры нашего concertino.

Предположим, произведение начинается в момент времени аккордом, в котором первым басам предписывается спеть ноту , где – wavelet-функция с Фурье-образом, носитель которого локализован у частоты , а – громкость, амплитуда, ноты (от итал. “bassi”), тенорам – исполнить ноту (от итал. “tenori”), которая в два раза короче басовой, но при этом в два раза выше нее, альтам – ноту (здесь обозначение происходит от итал. “alti”), которая в четыре раза короче басовой и в два раза короче теноровой нот и при этом во столько же раз выше нот басов и теноров, тогда как сопрано – ноту (от итал. “soprani”), которая в восемь раз выше басовой ноты и во столько же раз короче нее.

Очевидно, для обеспечения полнозвучности аккорда вторые тенора должны вступить в момент времени , вторые альты – в момент времени , вторые сопрано – в момент времени с нотами , , соответственно. Процесс трансляции и дилатации басовой ноты необходимо продолжить для исполнения аккорда другими альтами и сопрано хора.

Вообще говоря, аккорды могут быть записаны путем трансляций и дилатаций не только басовых нот: в том случае, если основной тон мелодики находится, например, у альтов, процесс “нотообразования” для теноров и басов может быть осуществлен посредством понижения частоты основного тона, а именно . Кроме того, необходимо подчеркнуть также возможность записи с помощью wavelet-функций произвольных музыкальных ходов (не только аккордных) как внутри одного такта, так и за его пределами, и даже всех нюансов исполнения!

Графическое представление описанной формы записи музыкального произведения соответствует процедуре многомасштабного анализа [1, 3, 4] (см. рис. 1). Естественно, время-частотная плоскость, соответствующая первому аккорду нашего произведения, может быть продолжена посредством привлечения к исполнению группы новых голосов (например, тенорантино, дискантов). Расширение время-частотной плоскости, например, камерного оркестра соответствует введению в оркестр инструментов духовой группы (гобоев, фаготов, флейт, кларнетов и т.д.), а также ударников и т.д.

Рис. 1

2. Пример

Рассмотрим результат wavelet-нотации музыкального произведения на примере сигнала, содержащего фрагмент арии Каварадосси (“Тоска” Дж. Верди), исполненного Э. Карузо (исходный сигнал и его спектральная оценка изображены на рис. 2а, б). На рис. 2в показан спектр сжатого сигнала, полученного с использованием wavelet-функций Хаара.

3. Заключение

Функции Хаара, весьма простые для построения wavelet-преобразования, являются не единственными функциями, которые могут быть использованы для записи музыки. В настоящее время существуют также другие wavelet’ы, синтезируемые посредством трансляции и дилатации материнских функций, например биортогональные wavelet-функции, wavelet-функции Добеши и др. [5].

а)

б)

в)

Рис. 2

Литература

1. Sweldens, W., Schroder, P. Building your own wavelets at home // “Wavelets in computer graphics”, ACM SIGGRAPH, 1996.
2. Бермант А.Ф., Араманович И.Г. Краткий курс математического анализа. – М.: Наука, 1973.
3. Новиков Л.В. Основы вейвлет-анализа сигналов. – С.-Пб.: ИАиП РАН, 1999.
4. Петухов А.П. Введение в теорию базисов всплесков. - С.-Пб., Изд-во СПбГТУ, 1999.
5. Истомина Т.В., Чувыкин Б.В., Щеголев В.Е. Применение теории wavelets в задачах обработки информации. – Пенза: Изд-во ПГУ, 2000.

Всероссийская научная конференция "Проектирование научных и инженерных приложений в среде MATLAB" (май 2002 г.)

На первую страницу \ Сотрудничество \ MathWorks \ SoftLine \ Exponenta.ru \ Exponenta Pro

E-mail:

Информация на сайте была обновлена 15.04.2003