Пресс-релизы // » Добавить пресс-релиз

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group
Компания: UDV Group
Добавлен: 23:26, 06.04.2026 Количество просмотров: 231
Страна: Россия


UDV Group усиливает управленческую команду: Максим Хараск назначен директором по развитию, UDV Group, 20:57, 27.05.2026, Россия51
UDV Group, российский разработчик решений в области информационной безопасности, объявляет о назначении Хараск Максима на позицию директора по развитию. Его приход усилит управленческую команду компании и станет важным шагом в реализации долгосрочных стратегических приоритетов UDV Group на динамично развивающемся рынке кибербезопасности.


CENTICORE GROUP НА КОНФЕРЕНЦИИ ANALYST DAYS 2026, Centicore Group, 21:01, 27.05.2026, Россия47
Centicore Group поделилась экспертизой на Analyst Days 2026: ИИ, поиск работы и резюме


Цифровизация культурного наследия Арктики выйдет на новый уровень при поддержке «Группы Астра», "Группа Астра", 21:01, 27.05.2026, Россия50
Партнерство АГУИККИ и ведущего игрока российского рынка инфраструктурного ПО — «Группы Астра» — даст возможность молодым специалистам повысить свой уровень ИТ-компетенций в сфере культуры и цифровых медиа. В дальнейшем они смогут наиболее эффективно использовать полученные знания для решения задач в области культуры, искусства и креативных индустрий.


TCL представляет телевизоры серии RM7L с технологией RGB-Mini LED — новое поколение яркости и цветопередачи, TCL, 21:00, 27.05.2026, Россия48
TCL представляет телевизоры серии TCL RM7L с технологией RGB-Mini LED.


Банк Русский Стандарт запустил АУСН на базе решения BSS: новый налоговый режим доступен клиентам в ДБО, BSS, 20:59, 27.05.2026, Россия58
Клиентам Банка Русский Стандарт из сегмента микро- и малого бизнеса стал доступен функционал Автоматизированной упрощенной системы налогообложения (АУСН), внедренный компанией BSS на базе ее промышленного решения.


Расследование мошенничества в Фармкомпании АО «РОШ Москва»: вскрыты схемы фиктивных сделок?, ООО Интерком, 20:59, 27.05.2026, Россия54
Продолжается затяжное расследование в фармкомпании Roche


Новинка от Tonmind: уличный рупорный IP-громкоговоритель SIP-S25V, АРМО-СИСТЕМЫ, 20:57, 27.05.2026, Россия55
Компания «АРМО-Системы» представила новые рупорные уличные IP-громкоговорители Tonmind SIP-S25V промышленного класса с мощностью 50 Вт, PoE-питанием, уровнем громкости до 128 дБ, поддержкой ONVIF и OPUS


«Группа Астра» перевела корпоративный контур 1С на машину БД Tantor XData 2B на базе процессора Baikal-S, "Группа Астра", 20:54, 27.05.2026, Россия48
«Группа Астра» расширяет использование программно-аппаратных комплексов собственной разработки в ИТ-инфраструктуре.


Финальный матч Кубка Гагарина собрал болельщиков из 41 региона, МегаФон, 20:52, 27.05.2026, Россия56
Вечером 21 мая «Татнефть Арене» в Казани приняла любителей хоккея из более чем 40 регионов России.


«Телфин» масштабирует чат-бота и переходит на платформу Max, Телфин, 20:51, 27.05.2026, Россия52
Российский провайдер коммуникационных сервисов «Телфин» объявляет об обновлении сервиса «Телфин.Бот» для контроля качества обслуживания. Теперь решение позволяет получать уведомления о звонках и СМС, а также записи и резюме телефонных разговоров — не только в Telegram, но и в Max.


CICADA8 CyberRating представила систему всестороннего интеллектуального аудита контрагентов на базе ИИ, CICADA8, 20:50, 27.05.2026, Россия60
CICADA8, компания по управлению уязвимостями и цифровыми угрозами в реальном времени, представила масштабное обновление первого в России решения для оценки безопасности подрядчиков и дочерних организаций CICADA8 CyberRating, благодаря которому борьба с атаками через партнеров выходит на новый уровень.


«Нетрика Медицина» обеспечит регионам бесперебойную онлайн-запись к врачу через витрины данных, Нетрика, 20:48, 27.05.2026, Россия37
Компания «Нетрика Медицина» (входит в N3.Group и ГК «Ташир МЕДИКА») запустила комплексную услугу по внедрению и сопровождению региональных витрин данных для электронной записи пациентов через ЕПГУ («Госуслуги»)


Hybrid Platform обновила интеграции с АТОЛ, Магнитом, X5 Dialog и МегаФоном для повышения точности таргетинга, Hybrid, 20:48, 27.05.2026, Россия40
AdTech-экосистема Hybrid, которая специализируется на высокотехнологичных разработках в области интернет-рекламы, расширила пул внешних источников данных в своей программатик-платформе.


МТС Банк автоматизировал прием сотрудников с помощью российской разработки от HRlink, HRlink, 20:47, 27.05.2026, Россия33
ПАО «МТС-Банк» (MOEX: MBNK) объявляет о запуске автоматизированного приема новых сотрудников. С помощью российского решения Start Link (входит в экосистему HRlink) банк уже смог оформить около 1 тыс. человек с начала года без необходимости готовить документы вручную.


«Справочник радиоинженера» от НПФ «Диполь»: все необходимое – от физических констант до практики измерений, RIGOL Россия, 20:46, 27.05.2026, Россия38
АО НПФ Диполь представляет практическое издание «Справочник радиоинженера». Электронная версия доступна для бесплатного скачивания на портале ITECH.


  © 2003-2026 inthepress.ru