Многие исследователи данных в настоящее время усердно работают над так называемым «прогнозированием беспорядков» – попыткой использовать алгоритмы, чтобы понять, когда и где может вспыхнуть конфликт в той или иной стране или сообществе.
Ключевую роль в этой работе играют такие организации, как CoupCast, проект Университета Центральной Флориды, который использует сочетание исторических данных и машинного обучения для анализа вероятности насильственного перехода власти в той или иной стране в любой конкретный месяц. По словам Клейтона Бесоу, который помогает руководить CoupCast, эти модели прогнозирования традиционно были направлены на зарубежные страны, но, уже сейчас, Америка всё больше и больше выглядит как разумный кандидат на внедрение такой системы.
«Из модели совершенно ясно, что мы вступаем в период, когда мы более подвержены риску продолжительного политического насилия», – сказал Бесоу в беседе с WashingtonPost.
Хотя все это может показаться весьма необычным, попытки использовать данные для прогнозирования беспорядков не являются чем-то новым. Как правило, они связаны со сбором огромного количества данных о конкретных группах населения, а затем вводят эти данные в модели прогнозирования. Вопрос заключается не в том, как все это работает, а скорее: «Действительно ли это работает?», а также «Действительно ли нам это нужно?».
Ещё в 2007 году Агентство перспективных оборонных исследовательских проектов (DARPA) работало над интегрированной системой раннего предупреждения кризисов (ICEWS) – программой, основанной на данных, предназначенной для прогнозирования социальных волнений в странах по всему миру. Созданная с помощью исследователей из Гарварда и военно-промышленной корпорации Lockheed Martin, программа утверждала, что создала модели прогнозирования для большинства стран мира и якобы могла давать «высокоточные прогнозы» относительно того, станет ли страна, скажем, свидетелем массовых беспорядков со смертельным исходом или нет.
Программа работала путем подачи огромных массивов данных из открытых источников, таких как региональные новости, в свою систему, которая затем использовала эти данные для расчёта вероятности того или иного инцидента, связанного с беспорядками в регионе.
«Секретный ингредиент во всём этом заключается в том, что мы используем так называемый смешанный модельный подход», – сказал Марк Хоффман, старший менеджер Лаборатории передовых технологий Lockheed Martin, в интервью журналу Signal в 2015 году. «Для любого события, скажем, восстания в Индонезии, у нас есть пять моделей, которые прогнозируют, произойдет ли оно на самом деле».
По словам Хоффмана, программа в конечном итоге была принята «различными частями правительства» (читай: разведывательным агентством), а также заинтересовала «страховую, риэлтерскую и транспортную отрасли».
Примерно в то же время, когда ICEWS находилась в стадии разработки, велась работа над проектом EMBERS – программой больших данных, запущенной в 2012 году, которая использует гигантские кэши открытых данных из социальных сетей для прогнозирования возможных угроз. Согласно статье в журнале Newsweek от 2015 года, «в среднем 80-90% прогнозов», составленных EMBERS, «оказались точными». Этот алгоритм якобы настолько хорош в своей работе, что предсказал такие события, как импичмент президента Парагвая в 2012 году, вспышку насильственных студенческих протестов в Венесуэле в 2014 году и протесты в Бразилии в 2013 году по поводу стоимости проведения чемпионата мира по футболу.
Если верить этим утверждениям, то это действительно впечатляет, но в то же время вызывает довольно простой вопрос: А что же тогда произошло в прошлом году? Если этот вид алгоритмического прогнозирования существует, почему никто в разведывательном комитете США не предвидел беспорядков, о которых открыто заявляли по всему Facebook и Twitter? Если этот метод настолько точен, почему никто не воспользовался им в тот роковой день в январе?
Согласно статье в WashingtonPost, промах заключается в том, что большинство этих программ и продуктов были направлены на прогнозирование событий в других странах — тех, которые могут представлять стратегическую угрозу для интересов США за рубежом. И они не так сильно нацелены на американцев.
Помимо потенциального скользкого пути нарушения гражданских свобод, который может вызвать этот вид алгоритмического наблюдения, наиболее очевидное беспокойство по поводу такого рода технологии прогнозирования заключается в том, что алгоритмы могут быть ошибочными, и что это заставит правительства реагировать на то, что никогда не должно будет произойти. Как отмечает WashingtonPost, это может привести к тому, что правительства начнут преследовать людей, которые в противном случае были быть просто мирными демонстрантами.
Однако ещё более волнующим вопросом может быть следующий: Что если алгоритмы окажутся верными? Разве не жутко представить, что правительства используют огромные объёмы данных для точного расчёта поведения населения на две недели вперёд? В любом случае нам, вероятно, нужно больше понимать о подобной технологии прежде чем запускать её.
Ещё по теме: