Нейрокомпьютинг и его применения в экономике и бизнесе



              

Совместная нормировка: выбеливание входов


Если два входа статистически не независимы, то их совместная энтропия меньше суммы индивидуальных энтропий:

H(\mbox{\~{x}}\mbox{\~{x}_j})\leq H(\mbox{\~{x}_i})+H(\mbox{\~{x}_i})
. Поэтому добившись статистической независимости входов мы, тем самым, повысим информационную насыщенность входной информации. Это, однако, потребует более сложной процедуры совместной нормировки входов.

Вместо того, чтобы использовать для нормировки индивидуальные дисперсии, будем рассматривать входные данные в совокупности. Мы хотим найти такое линейное преобразование, которое максимизировало бы их совместную энтропию. Для упрощения задачи вместо более сложного условия статистической независимости потребуем, чтобы новые входы после такого преобразования были декоррелированы . Для этого рассчитаем средний вектор и ковариационную матрицу данных по формулам:

\mbox{\={x}}\equiv\frac{1}{P}\sum^P_{\alpha=1},

\sum^X_{ij}\equiv\frac{1}{P-1}\sum^p_{\alpha=1}(x^\alpha_i-\mbox{\=x}_i)(x^\alpha_j-\mbox{\=x}_j)

Затем найдем линейное преобразование, диагонализующее ковариационную матрицу. Соответствующая матрица составлена из столбцов - собственных векторов ковариационной матрицы:

\sum_j\sum_{ij}^{X}U_{jk}=\lambda_kU_{ik}

Легко убедиться, что линейное преобразование, называемое выбеливанием (whitening)

\mbox{\~{x}_i}=(x_k-\mbox{\={x}_k})U_{ki}/\sqrt{\lambda_i}

превратит все входы в некоррелированные величины с нулевым средним и единичной дисперсией.

Если входные данные представляют собой многомерный эллипсоид, то графически выбеливание выглядит как растяжение этого эллипсоида по его главным осям ( рисунок 7.4).

Выбеливание входной информации: повышение информативности входов за счет выравнивания функции распределения

Рис. 7.4.  Выбеливание входной информации: повышение информативности входов за счет выравнивания функции распределения

Очевидно, такое преобразование увеличивает совместную энтропию входов, т.к. оно выравнивает распределение данных в обучающей выборке.




Содержание  Назад  Вперед