«Активная роль ИИ в противодействии коррупции в правительстве»

«Важность активной роли ИИ в борьбе с коррупцией в правительстве»

Изображение автора, созданное с помощью DALL.E 3

Революционизация усилий с помощью генеративных противоборствующих сетей и синтетических данных

Введение

Недавний взрыв моделей генеративного искусственного интеллекта (ИИ) привлек внимание всего мира к этике, рискам и вопросам безопасности. Конференция в Блечли-Парк в этом месяце вылилась в обязательство международного сотрудничества по обеспечению безопасности новых систем искусственного интеллекта. Однако эти же системы могут помочь решить схожие проблемы этического взаимодействия в других сферах.

Коррупция в государственном управлении и системные предвзятости являются серьезными преградами для процветания обществ. Синтетические данные и генеративный ИИ в форме генеративных противоборствующих сетей (GAN) предлагают не только возможность выявления коррупционных практик, но и предотвращения новых схем коррупции.

Распространенность и стоимость коррупции в государстве

Индекс восприятия коррупции Transparency International последовательно иллюстрирует всеобъемлющий характер этой проблемы в государствах. Ее разнообразные формы могут включать патронаж, взятки, непотизм, манипуляцию доказательствами, рэкет, и аналогичные действия, направленные на получение преимуществ путем злоупотребления должностью. Коррупция обременительна для экономики, и Всемирный банк прогнозирует общую сумму в 2,6 трлн долларов США ежегодно, приблизительно один триллион долларов США ежегодно является суммой взяток по всему миру. Однако последствия коррупции распространяются гораздо дальше. Коррупция разрушает доверие к публичным институтам, подрывает уважение к законам, угрожает основным услугам, таким как образование и здравоохранение, и отнимает необходимые средства для борьбы с изменением климата. Выгоды для заинтересованных лиц (или закрывающих глаза на это) и потенциальный риск для сохранности личности действуют как сильный стимул к молчанию свидетелей. ИИ предлагает важный инструмент для укрепления антикоррупционных органов.

Использование ИИ в борьбе с коррупцией

Искусственный интеллект находит применение при анализе сложных данных с сетью взаимосвязей. Хотя это не широко распространено, есть примеры использования ИИ для обнаружения преступного и коррупционного поведения.

В 2017 году испанские исследователи Феликс Лопес-Итурриага и Иван Пастор Санз использовали нейронные сети для создания прогностической модели коррупции в испанских провинциях. Они использовали реальные данные из базы данных по коррупционным делам, созданной газетой “Эль-Мундо”, анализируя годы, предшествующие обвинениям, чтобы выявить потенциальные предупреждающие знаки. Это позволило ИИ-модели обнаружить невидимые связи, такие как рост цен на недвижимость и коррупционные дела.

Использование ИИ для обнаружения подозрительного поведения и предотвращения мошенничества уже широко распространено в секторе банковской деятельности.

Украинская система идентификации рисков в государственных закупках (PROZORRO) использует программу под названием DOZORRO, разработанную для выявления потенциального коррупционного поведения при публичных закупках. Данные для обучения модели ИИ получены из оценки рисков, проведенной экспертами для около 3 500 тендеров. Система может независимо оценивать коррупционные риски при проведении тендеров и делиться результатами с общественными наблюдателями. Первые результаты показывают экономию миллиардов долларов, повышение легитимности правительства и, что важно в нынешнем контексте, большую вероятность привлечения иностранных компаний внести инвестиции.

В 2021 году Всемирный банк запустил платформу ProACT (Procurement Anti-Corruption and Transparency) на основе искусственного интеллекта. Используя данные из открытых источников в более чем 100 странах, она позволяет любому искать и просматривать государственные контракты на государственные закупки, их рейтинг прозрачности и потенциальные риски нарушения целостности.

Однако системы искусственного интеллекта основаны на данных, и нехватка надежных данных в исследованиях коррупции — хорошо известная проблема. Получение точных данных может быть сложным из-за скрытой природы коррупционных действий, записей, не содержащих нужных данных или содержащих ошибки, а также недостатка знаний о новых подходах и системах мошенничества.

Синтетические данные

Возможностью для решения многих из этих проблем может стать использование синтетических данных, которые создаются искусственно с помощью алгоритмов, а не собираются из реальных событий или процессов в мире. Они имитируют аутентичные данные, что делает их полезными для обучения моделей машинного обучения, когда настоящие данные недоступны, недостаточны или являются конфиденциальными. Модели могут учиться и адаптироваться в средах, имитирующих реальные сценарии коррупции, не рискуя нарушением конфиденциальности или компрометацией конфиденциальных данных.

Учитывая сложность коррупционных сетей и недостаток данных, синтетические данные обеспечивают уровень детализации, необходимый для обучения искусственного интеллекта обнаруживать тонкие паттерны коррупции, которые не отражены в более простых наборах данных. Построение реалистичных наборов данных позволяет системам искусственного интеллекта оснащаться средствами для исследования, понимания и прогнозирования.

Эти высококачественные фиктивные наборы данных могут тренировать системы искусственного интеллекта в различных сложных сценариях. Такой подход повышает безопасность и анонимность участников чувствительных расследований и обеспечивает сложность для распознавания и предсказания искусственного интеллекта паттернов коррупции.

Более того, исследования показывают, что системы искусственного интеллекта, обученные на синтетических данных, могут достичь уровней точности, сравнимых с обученными на реальных данных, но в значительно более короткие сроки и без этических и юридических осложнений, связанных с использованием реальных данных. Это означает, что обучение искусственного интеллекта с помощью синтетических данных эффективно и более способствует опережению изменений, вносимых преступниками (которые также используют искусственный интеллект для усиления своих подходов).

Сети генеративных противников (GAN): основная технология

GAN – это тип искусственного интеллекта, используемый для создания синтетических данных, которые используют две нейронные сети — Генератор и Дискриминатор — в динамическом процессе, при котором каждая сеть учится пытаясь перехитрить другую.

После обучения на ограниченных реальных данных Генератор создает синтетические подробные сценарии коррупции, в то время как Дискриминатор пытается определить, реальные ли его рассматриваемые данные или поддельные (также исходно опираясь на свое ограниченное обучение на реальных данных). Начальные создания могут быть грубыми, и Дискриминатор легко определяет правильный ответ. Однако Генератор учитывает это и совершенствует свои произведения. По мере того, как данные Генератора становятся все более реалистичными, способность Дискриминатора к различению также улучшается. Этот итеративный процесс продолжается до тех пор, пока окончательные синтетические данные не станут близкими репликами фактических и потенциальных реальных сценариев и тонких паттернов коррупции.

Данные, получаемые в результате этого, обходят проблемы, связанные с реальными данными, упомянутыми выше, особенно ограничения по доступности и конфиденциальности/секретности данных. Эта синтетическая база данных затем используется в качестве основы для обучения конкретных систем искусственного интеллекта, осуществляющих предсказание, обнаружение или анализ коррупции.

Отличие синтетических данных, созданных с помощью GAN

Увеличение количества и сложности синтетических данных, созданных с помощью GAN, позволяет правительствам и регулирующим органам улучшить свои возможности обнаружения, сделав их более готовыми к выявлению тонких и сложных форм коррупции, которые в противном случае могли бы остаться незамеченными.

Симулируя широкий спектр сценариев коррупции, GAN помогают создавать инструменты искусственного интеллекта, которые одновременно являются реактивными (обнаружение случаев коррупции) и прогностическими (идентификация развивающихся реальных сценариев, вероятность возникновения коррупции в которых возрастает). Системы искусственного интеллекта, обученные на синтетических данных, могут учиться на широком спектре потенциальных сценариев коррупции, включая те, которые не хорошо представлены или доступны в реальных данных. Это означает, что система искусственного интеллекта улучшает свое понимание паттернов коррупции и разрабатывает более надежные и интеллектуальные системы борьбы с ней.

Мировой банк выявил несколько способов, которым может развиваться коррупционное поведение, включая использование сложных структур данных и цифровых платформ для скрытия коррупционных действий, привлечение профессионалов (банкиров, юристов и бухгалтеров) в рамках сложных сетей и более сложные методы коррупции, направленные на обход новых международных стандартов.

По мере роста возможности для осуществления коррупционных действий, антикоррупционные усилия также должны стать более сложными. Скорость, с которой ИИ может генерировать, тестировать и повторно генерировать сценарии, а также разнообразие создаваемых им настроек, открывает возможность не только не отставать от, но и опережать темпы таких изменений.

Этические аспекты и проблемы конфиденциальности

Хотя использование синтетических данных позволяет уменьшить риски в области конфиденциальности, в начальной стадии их разработки требуется использование реальных данных из правительственных записей, аудиторских отчетов, данных об исполнении норм, баз данных государственного сектора, юридических и регуляторных документов, а также сообщений и жалоб информаторов. Понятно, что это представляет собой ряд рисков:

1. Конфиденциальная информация: Данные, обрабатываемые в правительственном контексте, часто содержат личные данные, конфиденциальные правительственные файлы или чувствительные финансовые записи. Информация в тендерных заявках, несомненно, является коммерческой тайной.

2. Внедрение предубеждений: Любые предубеждения или дискриминация (явная или неявная), содержащиеся в исходных данных, могут оказывать влияние на последующую систему. Например, предыдущая гендерная или расовая дискриминация в принятии решений, назначении на должности или назначении на роли – какой бы незаметной она ни была – будет восприниматься как часть базовой «правды», на основе которой машина формирует свои знания.

3. Риск неправомерного использования или нарушения данных: Системы искусственного интеллекта в государственном секторе могут стать объектом злоумышленников, из-за доступа к большим наборам данных, потенциально являющимися конфиденциальными, что может привести к нарушению данных или неправомерному использованию информации.

4. Развитие этического ИИ: При обучении систем ИИ выявлять схемы коррупции они должны делать это, не нарушая индивидуальных прав или создавая новые этические дилеммы.

5. Соблюдение закона: Строгие законы о защите данных все больше регулируют обработку персональных данных (например, GDPR).

6. Сохранение доверия общественности: Доверие к государственным учреждениям может быть подорвано, если ИИ-инструменты воспринимаются как нарушающие конфиденциальность или этические нормы.

Конкретные меры по снижению рисков, перечисленных выше, включают соблюдение соответствующих правовых рамок, внедрение надежных механизмов конфиденциальности, экспертное обзоры данных на наличие предубеждений, механизмы защиты персональных данных и прозрачность для общественности в отношении соблюдения этических норм. Проактивный подход повышает легитимность и надежность разрабатываемого ИИ и снижает риск того, что последующие уголовные преследования в сфере коррупции будут подорваны вызовами системам, используемым для их проведения.

Внедрение GAN и синтетических данных в антикоррупционные системы государства

Следующая диаграмма показывает пример, в котором GAN и созданные синтетические данные внедряются в систему обнаружения коррупции на основе ИИ.

Диаграмма, созданная автором
  1. Данные для начального обучения: Это включает идентификацию отраслей государственного сектора, склонных к коррупции, возможно, с привлечением экспертов из гражданского общества, занимающихся антикоррупцией. Затем проверяется исторические данные о коррупционных и некоррупционных ситуациях из различных сфер, с применением этических гарантий.
  2. Создание, обучение и работа GAN: Модель GAN получает начальное обучение на основе данных реального мира, а затем оставляется сама по себе для работы взаимодействий между своими двумя сетями, чтобы создать синтетические данные.
  3. Обучение и настройка моделей ИИ для обнаружения коррупции: Синтетические данные, полученные от GAN, используются для обучения новой модели ИИ на обнаружение схем, указывающих на коррупционные действия.
  4. Постоянный контроль в этическом и предубежденческом отношении: Хотя синтетические данные значительно снижают риск предубеждений и проблем конфиденциальности, все еще существует возможность возникновения оставшихся проблем.
  5. Пробный тест: Начальное тестирование может проводиться с использованием моделей ИИ, развернутых в контролируемых средах для оценки их эффективности в выявлении коррупционных практик (фидбек подается GAN для внесения корректировок).
  6. Масштабирование: Модели интегрируются в широкие системы государственного сектора (при этом непрерывно осуществляется контроль и вносятся соответствующие корректировки).
  7. Постоянное обучение и адаптация: Результаты работы системы обнаружения коррупции с использованием ИИ могут передаваться обратно в GAN через тот же процесс, который использовался ранее для проверки наличия предубеждений и устранения любых проблем, касающихся конфиденциальности или безопасности, чтобы обеспечить гибкость и адаптивность системы к новым тактикам коррупции и изменяющимся данным.

Заключение

Использование синтетических данных, созданных с помощью генеративно-состязательных сетей (GAN), является методическим подходом к борьбе с коррупцией, который выходит за рамки обнаружения текущих практик и позволяет прогнозировать и адаптироваться к возникающим тенденциям. С помощью непрерывного итеративного процесса система потенциально может идентифицировать и адаптироваться к будущим методам коррупции. Недостаток данных о коррупции — в особенности детальных данных, позволяющих системам обнаружения замечать все более тонкие индикаторы, потенциально распределенные по нескольким юрисдикциям — компенсируется способностью GAN разрабатывать новые данные для множества различных сценариев.

Этические вопросы остаются, хотя и существенно снижены, поэтому обеспечение защиты и контроль остаются ключевыми. Как основополагающий принцип хорошего управления, правительства и регулирующие органы должны по-прежнему придерживаться прозрачности и ответственности в качестве главных приоритетов.

Несмотря на то что это только начало, потенциал искусственного интеллекта в борьбе с коррупцией значительный. Темпы инноваций в коррупционных практиках ускоряются, применяясь искусственный интеллект для создания все более непрозрачных и запутанных сетей, предназначенных для обхода классических инструментов обнаружения. Антикоррупционные органы правительства должны поддерживать — как минимум, — схожую траекторию изобретений и вложений в синтетические данные, созданные с помощью GAN, предоставляющие возможность прогнозирования и, следовательно, снижения рисков. Более того, при потере триллионов в год из-за коррупции, развитие искусственного интеллекта в области, где успех может привести к прямому увеличению бюджета на общественные расходы, такое инвестирование позволяет правительствам выполнять свои обязательства перед своими гражданами.