Пресс-релизы // » Добавить пресс-релиз

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group
Компания: UDV Group
Добавлен: 23:26, 06.04.2026 Количество просмотров: 223
Страна: Россия


«Телфин» нарастил клиентскую базу продюсерского центра UniProject и в 4 раза увеличил процент дозвона до артистов, Телфин, 21:35, 05.05.2026, Россия90
Провайдер коммуникационных сервисов «Телфин» предоставил комплексные услуги облачной телефонии продюсерскому центру UniProject. В результате компания повысила качество ведения переговоров с артистами и в 10 раз увеличила клиентскую базу.


«Саммит Банк» перешел на российскую платформу унифицированных коммуникаций CommuniGate Pro, CommuniGate Pro, 21:34, 05.05.2026, Россия90
«Саммит Банк» завершил проект по миграции корпоративной почты на российскую платформу CommuniGate Pro.


RooX представила RooX UIDM CIAM++ — систему для построения клиентского ID и централизованного управления доступом, RooX, 21:33, 05.05.2026, Россия90
Компания RooX объявляет о выпуске продукта RooX UIDM CIAM++ — решения для управления аутентификацией и авторизацией внешних пользователей, ориентированного на построение единого клиентского ID и централизованного контроля доступа в цифровых сервисах.


GreenData и СберТех подтвердили совместимость low-code платформы с операционной системой SberLinux 10, GreenData, 21:33, 05.05.2026, Россия92
Компания GreenData совместно с АО «СберТех» завершила испытания low-code платформы GreenData на совместимость с актуальной версией операционной системы SberLinux 10.


В Proceset реализован Multi Task Mining для анализа стоимости и эффективности процессов, Инфомаксимум, 21:32, 05.05.2026, Россия85
В платформе Proceset от Инфомаксимум появился новый функционал — Multi Task Mining (анализ бизнес-операций с возможностью их объединения в бизнес-процессы), позволяющий рассчитывать стоимость процессов и выявлять приоритетные точки для автоматизации.


«Швабе» готовит кадры для медицинского приборостроения в образовательной экосистеме Ростеха, Холдинг «Швабе» Госкорпорация Ростех, 21:30, 05.05.2026, Россия84
Холдинг «Швабе» для решения задач опережающего развития обучает специалистов в области медицинского приборостроения. В частности, в Сеченовском медуниверситете готовят уникальных специалистов на стыке инженерии, IT и медицины – архитекторов медицинских изделий. Об этом рассказала директор по развитию проектов медицинского направления холдинга Валерия Тонкошкурова на круглом столе по теме подготовки кадров.


Система мониторинга и управления СТ.Монитор совместима с РЕД ОС, Смарт Текнолоджис, 21:25, 05.05.2026, Россия89
Компании «Смарт Текнолоджис Софт» и «РЕД СОФТ» объявили об успешном завершении тестирования программного продукта СТ.Монитор с операционной системой РЕД ОС версий 7.3 и 8.


Команда «Андагар» разработала международную платформу для торговли агропродукцией, Андагар, 21:25, 05.05.2026, Россия91
Решение, созданное ИТ-компанией “Андагар”, объединило производителей, поставщиков и ритейлеров на одной технологической площадке и позволило организовать прозрачные и быстрые сделки с возможностью международных поставок.


«Энергосбыт Волга» информирует о графике работы в праздничные дни, ООО "Энергосбыт Волга", 21:25, 05.05.2026, Россия88
В праздничные дни клиентские офисы компании будут работать по следующему графику:


«1С ПРО Консалтинг» представила рынку ролевую модель сотрудника, 1С ПРО Консалтинг, 21:23, 05.05.2026, Россия88
Компания «1С ПРО Консалтинг» разработала концепцию ролевой модели сотрудника, которую бизнес может внедрить для упрощения HR-процессов, повышения прозрачности управления и снижения затрат на поиск, адаптацию и развитие персонала.


HRlink включили в «белый список» Минцифры РФ, HRlink, 21:23, 05.05.2026, Россия87
Кадровый ЭДО HRlink вошел в «белый список» Минцфиры России и теперь доступен при вынужденных ограничениях мобильного интернета. О расширении перечня онлайн-ресурсов ведомство сообщило 23 апреля.


GitFlic 4.9.0: безопасность, искусственный интеллект и аудит в одной платформе, "Группа Астра", 21:21, 05.05.2026, Россия45
Обновление направлено на повышение безопасности цепочки поставок программного обеспечения, внедрение технологий искусственного интеллекта в процессы код-ревью, а также на развитие инструментов управления проектами и аудита.


Вовремя оплатить счета за электроэнергию и услуги ЖКХ помогут онлайн-сервисы, ООО "Энергосбыт Волга", 21:21, 05.05.2026, Россия43
Компания «Энергосбыт Волга» предлагает несколько способов оплаты счетов за электроэнергию и услуги ЖКХ. Сделать это можно как онлайн, так и очно в клиентском офисе до 15 мая.


Насчёт высоких ставок. «Выберу.ру» подготовил рейтинг лучших накопительных счетов за апрель 2026 года, Финансовый маркетплейс "Выберу.ру", 21:21, 05.05.2026, Россия57
«Выберу.ру» составил рейтинг банков с наиболее выгодными накопительными счетами. Топ-подборка поможет людям в мае получать доход выше, чем по вкладам.


В реестр Минпромторга РФ включены серверы «Гравитон» С2124АГ и С2124ОГ на базе отечественных плат «Арктика» и «Онега», «Гравитон», 21:21, 05.05.2026, Россия82
Компания «Гравитон», разработчик и производитель российской вычислительной техники, объявляет о внесении новых высокопроизводительных серверов С2124АГ и С2124ОГ в реестр промышленной продукции Минпромторга России.


  © 2003-2026 inthepress.ru