Информативность цветовых каналов BMP формата Козловский Евгений 2007 г.
Недостатки стандартного LSB метода
Идея LSB метода состоит в замене наименее значащих бит в цветовых каналах. Полагается, что в среднем половина бит только изменится, контейнер статистически будет устойчиво. Но это справедливо лишь для числа цветов изображения сопоставимым с количеством пикселей.
Но, конечно, это не так! В действительности, соотношение где-то 1:6.
Поэтому, следует перейти от т.н. fixed-sized LSB insertion к value-sized.
При этом появляется возможность встраивать заметно больше информации, контейнер оказывается статистически более устойчив.
Полезно рассмотреть особенности восприятия цветов человеком, т.н. информативность цветовых каналов.
Особенности зрительной системы человека
В области обработки изображений принято рассматривать светимость. Она равна лучистой мощности, разделенной на функцию спектральной чувствительности, которое характеризует зрение. Основываясь на результатах многочисленных экспериментов, светимость определяется как взвешенная сумма красного, зеленого и синего цветов с весами 77/256, 150/256, 29/256. Наш глаз очень чувствителен к малейшим изменениям чувствительности.
Зрительная система наоборот нечувствительна к зашумленным участкам изображения, участкам, которые не несут какой-либо психовизульно ценной информации.
Цветовые пространства и каналы
Существует 4 цветовых пространства и 11 цветовых каналов. Были взяты три изображения (Lena, Baboon, Sailboat) и по RGB-B каналу была встроена информация с долей встраивания 0.02. Далее исследовалcя уровень помех к доли встраивания.
Visibility measurement
В следующем тесте изменялся R канал. Интенсивность принимала малые, средние и большие значения. На гистограммах всплески соответствуют встроенной информации.
Выводы с результатов измерений
Восприятие изображения зависит от текстуры и границ. Наименее заметно встраивание в изображениях с большим разнообразием текстуры. Если изображение однотонное, то встраивание легко обнаружимо.
Границы изображения представляют наиболее значимую информацию для человека. Встраивание более заметно на границах, чем на текстурных областях.
Темные и светлые области изображения скрывают информацию лучше, чем средние тона. Зеленый цвет не приспособлен для встраивания информации, наиболее подходят для встраивания синий и желтый цвета.
Средняя интенсивность того или иного цвета изображения не очень хорошо его характеризует. Нет связи между средней интенсивностью цвета контейнера и восприимчивостью встроенной в него информации
Bit-slicing
Рассматривается изображение в т.н. Canonical Gray Coding system (CGC).
От системы Pure-Binary Coding, как известно, можно перейти к Canonical
Gray Coding. Далее осуществляется bit-slicing (n-битовое изображение
разлагается на n изображений).
Фильтрация шумов
Рассмотрев изображения, можно заметить, в шести изображениях присутствуют шумы. Любые цифровые изображение состоят из фрагментов, несущих информацию, и фрагментов с бесполезным шумом. Можно использовать эти области для встраивания информации.
Фильтрация шумов, выделение образов из хаоса – важнейшая особенность нашего восприятия. Из-за этой особенности можно заменять целые куски изображения.
Чем более значима битовая плоскость, в которой появляется шум, тем больше контраст черного среди соседних пикселей, тем больше битов может быть использовано для встраивания. Таким образом, следует высчитывать изменение черного в соседних пикселях.
Embedding capacity
Max(x,y) = max{f(x-1,y-1), f(x-1,y),f(x-1,y+1), f(x,y-1)}
Min(x,y) = min{f(x-1,y-1), f(x-1,y),f(x-1,y+1), f(x,y-1)}
D(x,y) = Max(x,y)-Min(x,y)
Kn(x,y)=└log2(D(x,y))┘
U(x,y)={4 при f(x,y)<191, 5 в других случаях}
K(x,y)=min{max{Kn(x,y),4},U(x,y)}
Анализ информативных и зашумленных областей
Определим сложность изображения как
α=k/макс. возм. Ч-Б изменения в изображении;
k – общая глубина черно-белой границы в изображении
0 ≤ α≤1; Это для всего изображения. То же самое можно
определить для части изображения, к примеру, 8*8 пикселей.
Определим как много бинарных шаблонов информативных и как
много зашумленных по отношению к α. Необходимо проверить 264
шаблонов. Но можно сгенерировать шаблоны, где значение
каждого пикселя случайное, но с вероятностью 0 или 1. Затем
строится гистограмма по α.
Анализ гистограммы
Было сгенерировано 4096000 шаблонов 8*8. Гистограмма почти в точности отражает функцию нормального распределения. Это ожидалось по главной предельной теореме. Среднее значение α было 0.5 и стандартное отклонение 0.047. Проведя дальше необходимые рассуждения, можно прийти к заключению, что большинство информативных паттернов расположены в диапазоне [0;0.5 - 8σ]. Это всего лишь 6.67.10 –14 % всех паттернов. Почти все паттерны шумящие!