Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Кибернетика и программирование
Правильная ссылка на статью:

Повышение эффективности стеганоанализа в области ДВП изображения посредством анализа параметров частотной области изображения

Сивачев Алексей Вячеславович

аспирант, кафедра Проектирования и безопасности компьютерных систем, федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики»

197101, Россия, г. Санкт-Петербург, Кронверкский пр., 49

Sivachev Aleksei Vyacheslavovich

graduate student, Department of Design and Safety of Computer Systems, St. Petersburg National Research University of Information Technologies, Mechanics and Optics

197101, Russia, g. Saint Petersburg, Kronverkskii pr., 49

sivachev239@mail.ru

DOI:

10.25136/2644-5522.2018.2.25564

Дата направления статьи в редакцию:

26-02-2018


Дата публикации:

18-03-2018


Аннотация: Объектом исследования являются методы стеганоанализа в области дискретного вейвлет преобразования (ДВП) изображения. В статье проведено исследование влияния факта встраивания в область ДВП на значения коэффициентов областей дискретно косинусного преобразования (ДКП) и дискретно синусного преобразования (ДСП) изображения с целью улучшения эффективности обнаружения факта встраивания в область ДВП. Показано влияние факта встраивания в область ДВП на определенные коэффициенты областей ДКП и ДСП изображения. В статье предлагается использовать определенные коэффициенты для повышения качества обучения машины опорных векторов. Метод исследования. Для оценки эффективности предлагаемого в статье метода стеганоанализа с использованием предложенных коэффициентов проводится сравнение эффективности классификации изображений с другими популярными методами стеганоанализа для области вейвлет разложения. В качестве стеганографического воздействия используется изменение значений младших значащих бит коэффициентов ДВП. Основные результаты. Показана возможность использования определенных коэффициентов ДКП и ДСП области с целью стеганоанализа в области ДВП. По результатам исследования проведенного предлагается оригинальный метод стеганоанализа, позволяющий добиться повышения эффективности стеганоанализа для областей LH и HL ДВП изображения. Полученные результаты могут быть использованы при разработке систем стеганоанализа для обеспечения эффективного обнаружения факта встраивания в область ДВП изображения.


Ключевые слова:

стеганография, стеганоанализ, частотная область изображения, дискретное вейвлет преобразование, дискретно косинусное преобразование, дискретно синусное преобразование, методы машинного обучения, машина опорных векторов, бинарная классификация, вейвлет область изображения

Abstract: The object of the study are the methods of stegan analysis in the area of discrete wavelet transformation of an image. The author investigate the influence of the fact of embedding in the region of a concrete wavelet transformation on the values of the coefficients of the regions of discrete cosine transform and image in order to improve the efficiency of detecting the fact of embedding into the discrete wavelet transformation domain. The influence of the fact of embedding in the region of discrete wavelet transformation on certain coefficients of regions of discretely cosine transform and discrete sine transformation of the image is shown. The author proposed to use certain coefficients to improve the quality of training of the support vector machine. Method of research: to assess the effectiveness of the steganoanalysis method proposed in the article using the proposed coefficients, a comparison of the efficiency of image classification with other popular steganoanalysis methods for the wavelet decomposition region is performed. As a steganographic influence, the values of the least significant bits of the coefficients of the discrete wavelet transform are used. Main results of the study is the possibility of using certain coefficients of discrete cosine transform and discretely sinus transformation of the region with the purpose of steganoanalysis in the region of discrete wavelet transformation is shown. According to the results of the study, an original method of steganoanalysis is proposed, which makes it possible to increase the efficiency of steganoanalysis for the LH and HL regions of the discrete wavelet transformation of the image. The obtained results can be used in the development of steganoanalysis systems to provide an effective detection of the fact of embedding into the discrete wavelet transformation region of an image.


Keywords:

steganography, steganalysis, frequency domain, discrete wavelet transform, discrete cosine transform, discrete sine transform, machine learning, support vector machine, binary classification, wavelet domain

Введение

Сегодня применение стеганография становится все более широко распространена, имеется информация об использовании стеганографии спецслужбами, а также криминальными и террористическими организациями [1,2]. Для противодействия противоправному использованию стеганографии служит стеганоанализ. Задачей стеганоанализа является определить имеется ли в анализируемом контейнера скрытая информация или нет.

Одним из наиболее популярных вариантов скрытия информации является ее встраивание в неподвижные цифровые изображения, на данный момент существует широкий спектр различных методов, позволяющих произвести встраивание информации в цифровые изображения [3], в том числе методов для встраивания информации в область ДВП разложения изображения, популярность которых обусловленное распространением формата JPEG2000 в котором используется ДВП преобразование для сжатия изображения. Для встраивания информации в область ДВП разложения изображения в зависимости от алгоритма могут быть использованы различные области коэффициентов (LL, LH, HL и HH) как по отдельности, так и несколько областей сразу [7]

Для противодействия им разработано большое число методов стеганоанализа[4], однако на данный момент не существует алгоритмов стеганоанализа позволяющих в любых условиях безошибочно определить содержит изображение встроенную информацию или нет, как правило имеет место определенная погрешность, приводящая к тому, что часть изображений может быть классифицирована неправильно, т.е. оригинальное изображение классифицировано как содержащее в себе встроенную информацию, а стегано изображение классифицировано как оригинальное[5]. Однако существующие на данный момент методы стеганоанализа, которые можно использовать для обнаружения встраивания в область ДВП изображения несовершенны [11] и сильно зависят от алгоритма встраивания. Например, эффективность метода [8] варьируется от 50 до 80% в зависимости от используемого алгоритма (при 20% объеме встроенной информации от максимальной вместимости контейнера), что очевидно является недостаточным. В связи с этим исследования в части повышения эффективности методов стеганоанализа предназначенных для обнаружения факта встраивания в область ДВП изображения являются актуальными.

В работе приводится описание набора параметров частотной области изображения, на которые оказывает заметное влияние встраивание в область вейвлет разложения изображения, особенно встраивание в LH область, что позволяет предложить метод стеганоанализа на основе использования данного набора параметров. В конце статьи приводится сравнение эффективности метода стеганоанализа, основанного на использование предлагаемого набора параметров, с другими методами стеганоанализа. Также в конце статье сделаны выводы о применимости метода, основанного на использовании предлагаемого набора параметров, для целей стеганонализа.

Исследование предметной области

В общем случае встраивание информации в область вейвлет разложения изображения представляет собой модификацию определенным образом выбранных вейвлет коэффициентов для передачи требуемой информации. По характеру воздействия на ДВП область, встраивание в общем случае можно рассматривать как добавление некоторого шума, например, шума Гаусса.

Изображение как таковое может быть представлено как набор гармонических колебаний с разными частотами, которые могут быть разделены на низкочастотные, среднечастотные и высокочастотные. Т.к. встраивание в изображение можно представить, как добавление некоторого шума к набору гармонических колебаний, составляющих изображения, то, следовательно, встраивание должно оказывать определенное влияние на параметры гармонических колебаний, особенно средней и высокой частоты.

Для разложения изображения на набор гармонических колебаний можно использовать различные ортогональные преобразования. В частности, дискретно косинусное преобразование (ДКП), которое широко известно из-за его использования в формате JPEG, или дискретно синусное преобразование (ДСП).

Двумерное дискретно косинусное и двумерное дискретно синусное преобразование может быть описано следующими формулами:

,

при этом и

где – значение пикселя изображения с координатами m и n, N и M – размерность изображения.

Встраивании информации в область ДВП происходит изменении значений коэффициентов области ДКП (ДСП). Для более наглядной иллюстрации разницы между коэффициентами области ДКП для оригинального и стегано изображения построим гистограмму разности коэффициентов области ДКП между оригинальным и стегано изображением – смотри рисунок 1а и 1б.

Рисунок 1а. Гистограмма разности коэффициентов области ДКП между оригинальным и стего (20% измененных коэффициентов области LH ДВП изображения) изображением.

Рисунок 1б. Укрупненный фрагмент гистограммы с рисунка 2а для значения коэффициента от 2 до 8.

Гистограммы разности коэффициентов ДКП показывают, что значительное количество коэффициентов ДКП подверглось изменению вследствие встраивания. При этом для абсолютного большинства коэффициентов изменение значения лежит в пределах от -2 до +2. В тоже время некоторые коэффициенты выбиваются из этой закономерности. На рисунке 1б показан один коэффициент для которого разница между оригинальным и стегано изображением составила более 7.

Данный коэффициент является одним из «угловых» коэффициентов, которые располагается в углах матрицы коэффициентов, получаемой при ДКП изображения. На данные коэффициенты, при встраивании в область ДВП, оказывается наиболее сильное влияние. Аналогично для коэффициентов области ДСП. При этом коэффициент области ДКП (ДСП) и «угловой» высокочастотный могут выступать в роли некоторой системы координат, относительно которой изменяются среднечастотные коэффициенты.

Данная закономерность, при которой значения «угловых» коэффициентов подвергаются заметно большему изменению по сравнению с другими коэффициентами области ДКП (ДСП), была проверена для изображений из коллекции BOWS2.

Значительное изменение «угловых» коэффициентов области ДКП (ДСП) при встраивании в область ДВП изображения может быть использовано для повышения эффективности стеганоанализа. Для наглядной оценки возможности классификации изображений с использованием «угловых» коэффициентов на рисунках 2(а, в, д) приведены гистограммы значений «углового» коэффициента области ДКП изображения, а на рисунках 2(б, г, е) приведены гистограммы значений «углового» коэффициента области ДСП изображения, для массива оригинальных изображений и для массива стегано изображений при встраивании в различные области ДВП изображения.

Рисунок 2а. Гистограмма значений «углового» коэффициента K (end,1) ДКП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в HL область.

Рисунок 2б. Гистограмма значений «углового» коэффициента K (end,1) ДСП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в HL область.

Рисунок 2в. Гистограмма значений «углового» коэффициента K (1,end) ДКП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в LH область.

Рисунок 2г. Гистограмма значений «углового» коэффициента K (end,1) ДСП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в LH область.

Рисунок 2д. Гистограмма значений «углового» коэффициента K (end,1) ДСП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в HH область.

Рисунок 2е. Гистограмма значений «углового» коэффициента K (end,end) ДСП для оригинальных изображений (синий) и для стегано изображений (оранжевый) при встраивании в HH область.

Представленные на рисунке 2(а-е) гистограммы показывают, что между массивами значений «угловых» коэффициентов для оригинальных и стегано изображений имеется заметная разница, которую можно использовать для классификации изображений. Таким образом добавление данных «угловых» коэффициентов в набор параметров для методов машинного обучения должно положительно сказываться на качестве обучения машины опорных векторов.

Описание предлагаемого метода

Выше показано влияние встраивания в область ДВП на значения определенных коэффициентов области ДКП (ДСП). В данной статье предлагается использовать значения данных «угловых» коэффициентов для улучшения эффективности методов стеганоанализа на основе машинного обучения при встраивании информации в область ДВП изображения. Таким образом для классификации изображений при использовании методов машинного обучения предлагается использовать следующий набор параметров:

· 1, 2, 3 и 4 статистические моменты для областей LL, LH, HL, HH, получаемые при двумерном ДВП изображения, которые также используются в других методах стеганоанализа [6, 8, 9, 10];

· «Угловые» коэффициенты (K (end,1), K (1,end), K (end,end)) матрицы коэффициентов, получаемые при двумерном ДКП изображения;

· «Угловые» коэффициенты (K (end,1), K (1,end), K (end,end)) матрицы коэффициентов, получаемые при двумерном ДСП изображения.

Таким образом общее количество параметров в наборе параметров, подаваемом на вход методу машинного обучения, составляет 20 штук.

Для классификации изображений на оригинальные и стегано изображения на основе данного набора параметров применяются методы машинного обучения, а именно машина опорных векторов для обучения которой используется обучающее множество, содержащее как оригинальные, так и стегано изображения. На вход машине опорных векторов поступает описанный выше набор параметров, а результатом работы машины опорных векторов является бинарная классификация изображения.

Условия проведения эксперимента и оценка эффективности предлагаемого метода стеганоанализа

Для оценки эффективности методов стеганоанализа была выбрана коллекция BOWS2 насчитывающая 10000 изображений с разрешением 512х512.

Для сравнения были выбраны следующие методы стеганоанализа:

· алгоритм, предложенный Gireesh Kumar и другими [8];

· алгоритм, предложенный Hany Farid [9];

· алгоритм, предложенный Changxin Liu и другими [10];

· алгоритм, предложенный Yun Q Shi и другими [6].

Для встраивания информации в область ДВП разложения изображения применялось одноуровневое двумерное дискретное вейвлетное преобразование, при применении которого мы получаем одну низкочастотную область вейвлет коэффициентов (LL область), две среднечастотные области вейвлет коэффициентов (LH и HL области) и одну высокочастотную область (HH область). Встраивание информации проводилось в каждую из них по отдельности путем модификации предпоследних бит коэффициентов области. Объем искаженных бит в области вейвлет разложения при встраивании составлял 15% от максимального объема данной области.

Из имеющегося множества изображений 20% изображений использовалось для обучения машины опорных векторов, а 80% изображений использовалось для оценки эффективности обучения.

Результатом работы метода стеганоанализа, основанного на методах машинного обучения, как правило, является бинарная классификация изображения: содержит изображение встроенную информацию или нет. Соответственно эффективность метода стеганоанализа можно оценить соответственно с корректностью его классификации: какой процент из проанализированных оригинальных изображений был классифицирован как оригинальные изображения, а также какой процент стегано изображений был классифицирован как стегано изображения. Идеальный алгоритм должен безошибочно классифицировать все оригинальные изображения как оригинальные изображения, а все стегано изображения как стегано изображения.

Экспериментальные результаты

Для оценки эффективности предлагаемого метода был проведен эксперимент по классификации изображений с помощью предложенного метода, а также других методов, взятых для сравнения. Результаты эксперимента представлены в виде графиков TN, FN, TP, FP, T и F, показывающих соотношение количества истинно отрицательных, ложноотрицательных, истинно положительных и ложноположительных для каждого метода стеганоанализа на рисунке 3(а-в).

График 3а. График соотношения TN, TP, FN, FP, T, N для LH области c объемом полезной нагрузки 15%.

График 3б. График соотношения TN, TP, FN, FP, T, N для HL области c объемом полезной нагрузки 15%.

График 3в. График соотношения TN, TP, FN, FP, T, N для HH области c объемом полезной нагрузки 15%.

Выводы

Графики, представленные на рисунках 4(а-в), показывают, что предложенный метод дает высокую эффективность для областей HL и LH.

Для области HL предложенный метод дает улучшение эффективности в 3,5%: предлагаемый метод дает 76,5% верно классифицированных изображений против 73,05% у метода, предложенного Hany Farid и другими [9] идущего следом за ним.

Для области LH предложенный метод дает небольшое улучшение эффективности в 0,18%, предлагаемый метод дает 67,03% верно классифицированных изображений против 66,85% метода [9].

Для области HH предложенный метод не дает улучшения эффективности и напротив уступает существующим методам стеганоанализа: 92,46% предлагаемого метода против 94,24% у метода [9]. Это может быть объяснено тем, что предлагаемый метод не использует полный набор параметров, который использует метод [9]

Заключение

Использование «угловых» коэффициентов областей ДКП и ДСП в дополнение к статистическим моментам, используемым методами [6,8-10], позволяет повысить эффективность стеганоанализа для областей LH и HL. Улучшение эффективности стеганоанализа для областей LH и HL объясняется тем, что значения дополнительных параметров изменяются в следствии встраивания в области LH и HL и позволяют машине опорных векторов более четко разграничить между собой оригинальные и стегоно изображения.

Библиография
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
References
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.