Рус Eng Cn Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Национальная безопасность / nota bene
Правильная ссылка на статью:

Прогнозирование риска террористических актов на основе алгоритмов машинного обучения

Новиков Андрей Вадимович

ассистент, Российский экономический университет им. Г.В. Плеханова

117997, Россия, Москва, г. Москва, пер. Стремянный, 36, каб. 339

Novikov Andrey Vadimovich

Assistant, Plekhanov Russian University of Economics

117997, Russia, Moskva, g. Moscow, per. Stremyannyi, 36, kab. 339

Camouflage@yandex.ru
Другие публикации этого автора
 

 

DOI:

10.7256/2454-0668.2022.1.36596

Дата направления статьи в редакцию:

06-10-2021


Дата публикации:

15-03-2022


Аннотация: Данная статья посвящена анализу и прогнозированию риска террористических актов на основе сравнения различных алгоритмов машинного обучения. Для того чтобы определить важнейшие показатели всесторонне рассматриваются более тридцати внешних и внутренних факторов риска путем их количественной оценки и строится начальный набор исходных данных. В исследовании анализируются многомерные социально-экономические и политические данные для 136 стран за период с 1992 по 2020 год. Также прогнозируются четыре показателя, отражающие предполагаемую успешность террористических атак, вероятность получения социально-экономических последствий и общего ущерба от терроризма. Помимо классических моделей анализа проводится сравнение эффективности других четырех алгоритмов машинного обучения, которые могут быть использованы для анализа многомерных данных. Для прогнозирования риска террористических атак создается модель случайного леса, а также на основе статистических критериев оценивается эффективность и точность модели. Для определения важнейших исходных показателей использовался метод рекурсивного устранения признаков в случайном лесу. Главный результат данного исследования заключается в определении важнейших показателей прогнозирования риска терроризма и сокращении избыточных индикаторов, что позволяет улучшить понимание основных характеристик нападений. Между тем, результаты показывают, что необходимо принимать надлежащие упреждающие меры не только в виде силовых операций задержания, разведки и реагирования, но и по улучшению стабильности государства, достижения социального равновесия и повышения качества жизни граждан.


Ключевые слова:

терроризм, террористический риск, факторы риска, машинное обучение, случайный лес, модель, противодействие терроризму, прогнозирование, социальные последствия, материально-экономические последствия

Abstract: This article is devoted to the analysis and prediction of the risk of terrorist acts based on a comparison of various machine learning algorithms. In order to determine the most important indicators, more than thirty external and internal risk factors are comprehensively considered by quantifying them and an initial set of initial data is built. The study analyzes multidimensional socio-economic and political data for 136 countries for the period from 1992 to 2020. Four indicators are also predicted, reflecting the expected success of terrorist attacks, the likelihood of socio-economic consequences and general damage from terrorism. In addition to the classical analysis models, the effectiveness of the other four machine learning algorithms that can be used to analyze multidimensional data is compared. To predict the risk of terrorist attacks, a random forest model is created, and the effectiveness and accuracy of the model are evaluated based on statistical criteria. To determine the most important initial indicators, the method of recursive elimination of features in a random forest was used. The main result of this study is to identify the most important indicators for predicting the risk of terrorism and to reduce redundant indicators, which makes it possible to improve understanding of the main characteristics of attacks. Meanwhile, the results show that it is necessary to take appropriate proactive measures not only in the form of forceful detention, intelligence and response operations, but also to improve the stability of the state, achieve social balance and improve the quality of life of citizens.


Keywords:

terrorism, terrorist risk, risk factors, machine learning, random forest, model, countering terrorism, forecasting, social consequences, material and economic consequences

Введение

Террористические нападения как один из наиболее актуальных видов конфликтов обычно происходят неожиданно, приводят к человеческим жертвам и в конечном итоге сеют хаос [18]. По данным «Глобальной базы данных по терроризму» (GTD), число террористических нападений в мире выросло в среднем с 1000 случаев в год в начале XXI века до более чем 7000 случаев в 2020 году [25]. Хотя правительства многих стран за этот период потратили огромные суммы на борьбу с терроризмом, результаты оказались не столь впечатляющими как могли бы быть. Контртеррористические операции, такие как упреждение и пресечение террористических атак, широко применяются, но иногда они могут еще больше подпитывать нападения, а не предотвращать их [12]. Прогнозирование риска террористических актов полезно для разработки превентивных мер, а также для обеспечения более целенаправленного долгосрочного формирования политики. Однако факторы, влияющие на риск террористических нападений, многочисленны и сложным образом взаимосвязаны. Эта неоднозначность осложняет прогнозирование и может привести к необдуманным политическим решениям, которые бесконечно оттягивают ресурсы и создают панику среди населения. Поэтому очень важно определить важнейшие показатели, влияющие на риск террористических актов, на основе которых прогнозирование станет более четким и надежным, а решения по противодействию терроризму станут более активными [9].

В последние годы, благодаря развитию технологий машинного обучения и их способности эффективно выявлять многофакторные взаимосвязи, соответствующие научные работы постепенно преодолевают кажущуюся «непредсказуемой» проблему прогнозирования террористических атак [5]. Эти работы можно разделить на две категории. В первой категории в основном применяются показатели уровня отдельных террористических инцидентов для прогнозирования будущего характера терроризма. В работе Н. Мо отобраны 56 исходных атрибутов террористической атаки из базы GTD, включая время, местоположение, тип атаки и т.д., и классифицировали типы терроризма с помощью метода опорных векторов (SVM), наивного байесовского классификатора (NB) и логит-регрессии (LR) [31]. Исследование К. Мину использует вейвлет-нейронные сети и GARCH-модели для прогнозирования будущего времени террористических атак на основе исторических данных о численности нападений в месяц [30]. Х. М. Исмаил и Х. Кази применяли 16 атрибутов уровня конкретного инцидента (таких как год, тип атаки, количество исполнителей и т.д.) для оценки характера террористических атак на основе ансамблевого классификатора, объединяющего байесовские модели и модели дерева решений (DT) [26]. В работе Р. Т. Брандт использовалась байесовскую модель с переключением Маркова (англ. Markov-switching Bayesian model) для прогнозирования интенсивности будущих конфликтов на основе предыдущих террористических инцидентов [13]. Также ряд отечественных авторов использовали байесовские модели и случайные леса для моделирования вероятности терроризма [3, 5].

Однако в работах первой категории рассматриваются только показатели микроуровня, связанные конкретными атаками, и игнорируется влияние «коренных факторов» терроризма, которые иначе связываются с макро-условиями или внешней средой [6]. Нападения происходят в более широком контексте терроризма и эти сложные условия охватывает политические, экономические, религиозные и другие факторы. Обширная группа работ сосредоточены на коренных причинах терроризма, начиная с М. Креншоу в качестве наиболее репрезентативной ранней работы [19]. В этой литературе используемые методологии включают качественный анализ, основанный на теоретических положениях, и количественные эмпирические исследования с использованием статистических инструментов. Основные выводы, касающиеся внешних факторов терроризма, включают: 1) бедность не может напрямую привести к терроризму [10]; 2) демократия снижает прямые издержки, связанные с совершением террористических нападений, но также увеличивает относительные издержки [22]; 3) урбанизация является питательной средой для терроризма [19]; 4) страны с растущим населением, по-видимому, меньше страдают от терроризма [21]; 5) терроризм плотно связан с другими видами политического насилия, конфликтов и войн [14]. В целом, можно достичь консенсуса в отношении того, что происхождение и распространение терроризма обусловлены широкими и далеко идущими политическими, экономическими, этническими и другими проблемами [2]. Однако эти факторы недостаточны для объяснения конкретных случаев нападений [4]. В рамках усилий по прогнозированию во временных рядах необходимо учитывать как факторы инцидентов в качестве внутренних причин террористических атак, так и внешние условия.

Исходя из этого, исследования второй категории по прогнозированию атак учитывают факторы макроуровня при составлении прогнозов. С. Перри рассматривает 30 экономических показателей, которые измеряют такие факторы, как безработица, доходы и прогнозирует смертность от терроризма с использованием нейронных сетей обратного распространения (BP) [33]. Также Н. В. Вайдман и М. Д. Уорд используют четыре показателя внешних условий, содержащих численность населения, этнический состав и ландшафт для прогнозирования конфликтов на уровне муниципалитетов на основе пространственно-временной логистической модели [37]. В работе М. Хао используется случайная оценка плотности лесов и ядер для прогнозирования потенциального риска террористических нападений на полуострове Индокитай [24]. Главным образом в этой работе с помощью 15 показателей внешних условий, содержащих три социальных показателя (хрупкость государства, плотность населения, распространение наркотрафика) и одиннадцать географических показателей, таких как средняя температура и топография. В отличие от такого подхода, который рассматривает только показатели первопричин, Ф. Динг рассматривает как характеристики инцидентов, так и показатели макроуровня [20]. Здесь используется нейронная сеть обратного распространения (BPNN), SVM и случайный лес (RF) для прогнозирования риска террористических атак в различных странах в основном анализируя три индикатора инцидентов (таких как широта и долгота) и 10 макро-причин, содержащих пять географических показателей (например, среднее количество осадков), а также четыре демографических показателя. Во второй категории исследований по прогнозированию террористических атак оценивался статус факторов внешней среды.

Тем не менее, существующие исследования в области оценки риска в основном направлены на повышение точности прогнозирования на основе предварительно выбранных показателей, представляющих различные факторы, связанные с террористическими актами, и реже возвращаются к обоснованности выбора показателей [7]. Отчасти это связано с тем, что «черный ящик» моделей машинного обучения с многочисленными параметрами и сложными выводами затрудняет четкий анализ причинно-следственных связей между целевыми зависимыми и независимыми переменными [34]. Таким образом, внутренний механизм модели обучения недостаточно ясен и взаимосвязь между показателями не может быть понята интуитивно. При этом после изменения входных показателей первоначальные выводы перестают быть надежными [15].

Методология

Общая структура предлагаемого подхода состоит из четырех этапов. Прогнозирование риска террористических атак в разных странах за конкретный год производится с использованием скользящего окна с несколькими входами и выходами. Риск террористических атак как прогнозируемая цель состоит из четырех основных подкомпонентов: 1) Произойдет ли в следующем году более одного крупного террористического акта? 2) Каков максимальный уровень имущественного ущерба, причиненного террористическими актами в следующем году? 3) Каков максимальный уровень человеческих жертв в результате террористических нападений в предстоящем году? 4) Каков средний показатель успеха террористических атак в следующем году? Поскольку нецелесообразно считать каждое террористическое нападение одинаково важным и уделять им равное внимание, если не проводятся различия между серьезностью атак [18]. В целом же это исследование больше касается риска нападений с тяжелыми последствиями.

Что касается входных данных (независимых переменных) для прогнозирования, то учитываются как внешние так и внутренние факторы. Внешние факторы играют роль невидимой руки и представляют различные аспекты состояния социальной аномии, непосредственно приводящие к распространению терроризма и косвенно к террористическим нападениям [11]. Внутренние факторы являются как триггерами, так и последствиями террористических атак, подпитывая террористический феномен посредством самовоспроизводящейся петли обратной связи [27]. В общей сложности в качестве предикторов были выбраны 28 показателей, из которых 17 – индикаторы макроуровня, а остальные 11 связанны с внутренними характеристиками нападений.

Исходные данные, используемые в этом исследовании, собраны из трех хорошо известных баз данных, таких как «Глобальная база данных о терроризме» (GTD), «Международное руководство по страновым рискам» (ICRG) и база данных «Всемирного банка» [35, 36, 38]. GTD является одной из крупнейших баз данных о террористических атаках с открытым доступом, в которой с 1970 года регистрируются цель, тип атаки, местоположение и другие показатели террористических атак. ICRG регистрирует показатели каждой страны за каждый год в трех подкатегориях рисков: политических, финансовых и экономических. База данных «Всемирного банка» содержит надежные статистические социально-экономические данные на страновом уровне.

Выбор показателей и предварительная обработка данных

Террористические нападения вытекают из абстрактного контекста терроризма, в котором различные факторы способствуют процессу радикализации, а показатели представляют собой количественную интерпретацию факторов. Как показано на рис. 1, процесс перехода от радикализма до террористических атак состоит из нескольких этапов [12]. Во-первых, терроризм распространяется из-за глубоко укоренившихся структурных причин. Во-вторых, некоторые граждане становятся террористами под влиянием внешних обстоятельств и субъективных индивидуальных причинных факторов. Наконец, из-за конкретных триггеров или воспроизводящейся обратной связи с предыдущими актами террористы совершают все новые и новые нападения [8].

Рис. 1. Процесс перехода к терроризму под воздействием внешних факторов.

Источник: составлено автором.

Структурные, ускоряющие и мотивационные факторы рассматриваются как три подкатегории причин терроризма, основанные на исследовании Т. Бьорго [12]. Структурные причины – это факторы, влияющие на жизнь людей на макроуровне, которые люди могут осознавать или не осознавать. Ускоряющие факторы делают терроризм «привлекательным» и стимулируют людей становиться более склонными к политическому насилию или вступлению в террористические организации. Мотивационные факторы – это личный опыт людей, побуждающий их применять террористическую тактику, в том числе вступать в радикальные организации или готовиться к террористическим атакам. Факторы в этих трех подкатегориях в первую очередь способствуют распространению терроризма и вербовке боевиков. Причем мотивационные причины также потенциально могут привести к атакам, но только на подготовительном этапе. Провоцирующие и факторы обратной связи рассматриваются как два компонента причин на уровне конкретных инцидентов. Провоцирующие факторы являются прямыми предшественниками конкретных атак. Например, конкретные конфликты, спорные события и т.д. Факторы обратной связи в основном представляют собой весь предыдущий цикл террористических нападений. После совершения террористического акта в последующем процессе участвуют множество аудиторий, включая союзников, врагов, членов террористической организации, невинных гражданских лиц. Последствия, намерения и детали нападений могут быть раскрыты СМИ, что может привести к эффекту эскалации, еще больше повышая риск следующей атаки.

В таблице 1 приведены конкретные показатели, которые количественно измеряют вышеупомянутые факторы. Структурные факторы часто могут быть измерены экономическими, политическими, культурными и другими показателями в качестве долгосрочного двигателя атак, такими как: стабильность правительства, социально-экономические условия, рост ВВП и безработица. Между тем, эти показатели также могут быть использованы в качестве среднесрочных мотивационных и ускоряющих факторов. Например, когда конкретный человек все еще имеет работу, безработица может быть лишь показателем абстрактной структурной причины, которая непосредственно им не ощущается. В свою очередь, когда этот человек безработный, реальность разочарования, может служить показателем ускорения или мотивационной причины. Поскольку показатели обычно могут функционировать на разных уровнях, в этом исследовании было отобрано 17 показателей из ICRG и «Всемирного банка» для представления этих факторов. Индикаторы «Критерии 1-3» из GTD могут представлять собой провоцирующие причины. «Критерий 1» показывает, является ли целью атаки достижение политической, экономической, религиозной или социальной цели, а не получение прибыли или чисто личного интереса. «Критерий 2» указывает, является ли целью нападения принуждение, запугивание или передача других сообщений более широкой аудитории, чем непосредственные жертвы. «Критерий 3» оценивает, была ли атака нацелена на жертв, не являющихся комбатантами. Таким образом, GTD уже предоставляет подробные индикаторы, позволяя выразить намерения, цели, движущие силы различных террористических атак. Аналогичным образом, в GTD имеются подробные показатели последствий террористических нападений и успеха или неудач каждого акта. Все индикаторы, использованные в этом исследовании, подробно описаны в таблице 1.

Таблица 1. Описательная статистика независимых (входных) переменных.

Источник

Индикаторы

Среднее

Дисперсия

Минимум

Максимум

GTD

Тип местности атаки

0,656

0,136

-0,465

1,005

GTD

Критерий 1

0,693

0,134

-0,386

1,134

GTD

Критерий 2

0,714

0,123

-0,359

1,159

GTD

Критерий 3

0,66

0,134

-0,465

1,092

GTD

Успешность атаки в предыдущем году

0,557

0,169

-0,514

1,021

GTD

Тип атаки

2,760