Rambler's Top100 II Всероссийская конференция пользователей MATLAB, 25-26 мая 2004 года >>
На первую страницу
Рубрика Matlab&Toolboxes
Российские MATLAB-разработки
Ваш Login: "prodav".
Раздел "Обработка сигналов и изображений\Wavelet Toolbox"

"Вейвлеты, аппроксимация и статистические приложения" (перевод К.А.Алексеева)

В оглавление \ К следующему разделу \ К предыдущему разделу

11.4 Трешолдинг: математические основы

При изучении свойств вейвлет-оценок весьма часто оказывается полезным введение в рассмотрение некоторой идеализированной статистической модели, аппроксимирующей истинную.

Положим, представляют собой эмпирические коэффициенты разложения, рассчитанные с использованием техники, введенной в параграфе 10.2. Очевидно, можно записать, что

,

,

(11.13)

причем здесь представляют собой истинные, неизвестные коэффициенты разложения, - случайные числа с нулевым средним и дисперсией, равной 1 (оценки (11.10) являются несмещенными оценками истинных коэффициентов разложения), - некоторые поправочные коэффициенты.

Будем далее предполагать, что скейлинг- и вейвлет-функции, используемые для расчета коэффициентов разложения, имеют компактный носитель: лишь некоторое конечное число М коэффициентов детализации, следовательно, являются ненулевыми. Отметим также, что распределение будем считать асимптотически гауссовым, тогда как сами отсчеты не коррелирующими с . Иначе говоря, если , то

для всякого , поскольку

=

.

Помимо этого, поскольку , ковариация для больших j оказывается много меньшей дисперсии:

.

(11.14)

Теперь можно предположить без всякой математической строгости, что модель наблюдения (11.13) может принять следующий вид:

(11.15)

для всех при условии, что роль эмпирических коэффициентов детализации здесь играет параметр , роль истинного, неизвестного и, таким образом, искомого коэффициента детализации - параметр , и, наконец, - роль отсчетов шума . О параметре будет сказано несколько позже.

Итак, обращая еще раз внимание на то обстоятельство, что выражение (11.15) являет собой идеализированную модель вейвлет-коэффициентов на фиксированном уровне рассмотрения, индекс j в дальнейших выкладках можно опустить. Кроме того, число отсчетов данных М в данной задаче может быть произвольным, однако не следует забывать о том, что кратность данного числа степени является всё же предпочтительным.

Целью построения модели (11.15) является поиск неизвестных параметров (истинных коэффициентов детализации) , кроящихся в эмпирических коэффициентах (отметим в скобках, что данная модель может быть использована для синтеза непараметрических вейвлет-оценок гауссова белого шума и т.д.). Кроме того, в случае белого гауссова шума (10.56), (10.57) значения являются гауссовыми с нулевым средним и дисперсией, равной 1. Обозначая через , запишем модель в виде:

.

(11.16)

В этом случае модель является точным (не аппроксимирующим) эквивалентом исходной модели.

Модели подобного рода позволяют дать приемлемую интерпретацию процедурам трешолдинга, введенным выше в данной главе. Прежде всего проанализируем белый гауссов шум. Известно, что для набора М значений гауссовой переменной можно записать: . Следовательно, в том случае, если значение порога установлено равным , сигнал, представляющий собой только шум (), может быть оценен с высокой степенью вероятности как нулевой: нет смысла увеличивать значение порога выше .

Задание значения порога в виде , где N есть общее число рассматриваемых отсчетов, позволяет корректно оценить нулевой сигнал на всех уровнях j. Такой порог, называемый универсальным, как правило, обнуляет большую часть коэффициентов, оставляя нетронутыми лишь малую их часть. Как результат, оценка, полученная таким образом, имеет гладкий вид без пиков и выбросов. Правда, такой эффект достигается потерей точности оценивания.

Обратимся теперь к рассмотрению модели (11.16). Разумные рассуждения подсказывают выбор следующего порога: для оценивания коэффициентов . Поскольку при оценивании плотности является пропорциональным , следовательно, . Это обстоятельство проливает свет на процедуры трешолдинга (11.7), (11.8). Выбор фиксированного значения мотивируется здесь аналогичными рассуждениями, содержащими тот факт, что число уровней j разложения обычно имеет порядок (см. параграфы 10.2, 10.4).

Универсальный порог можно рассчитать для модели (11.16) таким образом, как показано в работе [40]:

,

где множитель, стоящий перед знаком радикала, представляет собой робастную оценку поправочного коэффициента, определяемого как медианное (срединное) абсолютное отклонение эмпирических коэффициентов разложения на наивысшем уровне. При этом главной причиной рассмотрения наивысшего уровня для целей оценивания дисперсии является то обстоятельство, что данный уровень содержит главным образом шумовую составляющую в противоположность наинизшему уровню, который, как известно, заключает в себе лишь общую форму функции.

11.5 Адаптивный трешолдинг и критерий Стейна

В настоящем параграфе обсуждается вопрос выбора порога, начального уровня разложения и базиса вейвлет-функций, основанный на технике Стейна [138] несмещенной оценки риска.

Прежде всего, рассмотрим, собственно, критерий Стейна для идеализированного одноуровневого случая, предложенного в предыдущем параграфе:

.

Положим, представляют собой вектор оценок истинных коэффициентов . Введем среднеквадратичный риск

,

предполагая, что оцениваемые значения определяются с использованием выражения

,

(11.17)

в котором есть некоторая слабо дифференцируемая функция действительной переменной. Отметим, что параметр является в данном случае общей переменной, порогом, статистической константой и т.д.

Иначе говоря, выражение (11.17) определяет семейство оценок, индексируемых посредством , для которых поиск оптимального является основной задачей. Условимся считать в дальнейшем за значение параметра , при котором риск является минимальным.

В том случае, если на практике истинные значения коэффициентов оказываются известными, вычисление не вызывает никаких затруднений. Очевидно, в реальных ситуациях приходится довольствоваться лишь их оценками , и, следовательно, строить оценки значений на основании несмещенной оценки .

Для построения оценки риска следует заметить, что

,

(11.18)

причем

.

Действительно, производя несложные выкладки, можно заметить, что

,

.

Данное выражение позволяет в итоге записать, что , или . Последнее выражение представляет собой несмещенную оценку риска. Точнее, данную оценку можно назвать оценкой риска Стейна и записать ее в виде:

Аббревиатура  SURE происходит от англ. Stein's Unbiased Risk Estimator (Прим. переводчика). 1

Критерий Стейна выбора значения состоит в минимизации оценки риска по отношению ко всем значениям :

.

(11.19)

Здесь уместно показать, что несмещенность не гарантирует, что оценка может оказаться достаточно близкой к .

Сформулируем теперь принцип Стейна применительно к мягкому трешолдингу.

Для мягкой функции пороговой обработки (10.13) имеем:

,

(11.20)

и, следовательно,

.

(11.21)

Как результат, оценка риска Стейна в данном случае примет вид:

.

Из приведенного выражения видно, что первая разность квадратов, свободная от случайного индикатора, не является зависимой от . Следовательно, поиск оценки следует рассматривать относительно второго слагаемого:

.

(11.22)

Положим, существует вектор индексов, позволяющих упорядочить коэффициенты следующим образом: . В соответствии с выражением (11.22)

,

(11.23)

определяемое как

.

(11.24)

Так, например, при М=1 выражение (11.24) сводится к оценке

Тогда, очевидно, можно заключить, что вычисление порога , определяемого выражением (11.22), потребует операций, если при этом используется алгоритм сортировки М коэффициентов .

Перейдем теперь к рассмотрению более реалистичной модели функции плотности. В частности, исследуем вопросы выбора:

  1. адаптивного порога для каждого из уровней разложения ,

  2. начального уровня разложения ,

  3. выбора скейлинг-функции и вейвлет-функции анализа.

Для демонстрации решения задачи запишем модель функции плотности:

,

(11.25)

где , - эмпирические коэффициенты разложения, прошедшие процедуру мягкой пороговой обработки (10.2), (10.3), (10.13), (11.20). В данном случае вектор порогов примет вид:

.

Зависимость модели от вейвлет-функции в записи опущена: здесь предполагается, что вейвлет-функция является канонически связанной с скейлингом (см. параграф 5.2). Наконец, подобно (11.18) можно показать, что при соблюдении ряда условий

.

В итоге несмещенная оценка риска Стейна примет вид:

.

(11.26)

С целью получения наилучшей оценки из набора (11.26), очевидно, представляется необходимой процедура выбора адаптивного порога для каждого из уровней разложения , начального уровня разложения , выбора скейлинг-функции и вейвлет-функции анализа.

  1. Выбор порогов осуществим следующим образом:

    .

  2. Выбор начального уровня разложения - следующим образом:

    .

  3. Наконец, выбор функций анализа -

    ,

    причем поиск происходит при исследовании всех заданных базисов с компактным носителем.

Замечание 11.3. Поскольку на практике значения дисперсий коэффициентов являются неизвестными, можно использовать их эмпирические версии. Так, например, если считать выражение (11.26) моделью функции плотности, то, значения можно заменить ее оценкой:

.

(11.27)

Действительно, для коэффициентов детализации, определяемых посредством (10.3), имеем:

.

Замечание 11.4. В том случае, если оказывается необходимым проведение трешолднга лишь коэффициентов детализации (что чаще всего бывает), функция , применяемая к коэффициентам аппроксимации, должна быть равна 0. Тогда, выражение для риска Стейна принимает вид:

.

Применим в заключение принцип Стейна на конкретной задаче регрессионного оценивания. Выберем для этого ступенчатую функцию

,

состоящую из 128 эквидистантных отсчетов, взвешенных гауссовым шумом с дисперсией 1/128. Воспользуемся критерием Стейна лишь для поиска порога, тогда оценки риска для примут вид:

.

На рис. 11.1 показана истинная регрессионная функция вместе шумовыми данными, тогда как на следующем, 11.2, ее SURE-оценка. Истинная кривая на обоих рисунках отмечена пунктирной линией.

Рис. 11.1

Регрессионная функция и ее зашумленная версия

Рис. 11.2

Оцениваемая функция и ее SURE-оценка

1 - Аббревиатура SURE происходит от англ. Stein's Unbiased Risk Estimator (Прим. переводчика).

В оглавление \ К следующему разделу \ К предыдущему разделу


О получении локальных копий сайтов
  I Всероссийская научная конференция "Проектирование научных и инженерных приложений в среде MATLAB" (май 2002 г.)
  II Всероссийская научная конференция "Проектирование научных и инженерных приложений в среде MATLAB" (май 2004 г.)
На первую страницу \ Сотрудничество \ MathWorks \ SoftLine \ Exponenta.ru \ Exponenta Pro   
E-mail: info@matlab.ru   
  Информация на сайте была обновлена 16.08.2004 Copyright 2001-2004 SoftLine Co 
Наши баннеры  

 

Rambler's Top100    TopList