Пресс-релизы // » Добавить пресс-релиз

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group
Компания: UDV Group
Добавлен: 23:26, 06.04.2026 Количество просмотров: 237
Страна: Россия


«Kulikov Group» централизовала обучение сотрудников и сократила срок адаптации с трёх до двух месяцев с помощью iSpring LMS, iSpring, 22:28, 15.06.2026, Россия401
Компания «Kulikov Group» перешла на единую систему корпоративного обучения на базе iSpring LMS. Это позволило объединить все разрозненные инструменты в единый контур и внедрить структурированную систему адаптации и развития сотрудников.


Web3 Tech: России нужна собственная институциональная Web3-инфраструктура, Web3 Tech, 22:27, 15.06.2026, Россия396
В Web3 Tech назвали тренды институционального рынка web3. По мнению экспертов компании, глобальный финтех переходит в новую фазу, при которой стейблкоины, системное регулирование и ИИ-агенты сливаются в единый контур агентной экономики на цифровых активах с потенциалом $30 трлн к 2030 году.


GreenData подтвердила совместимость low-code платформы с Astra Linux Special Edition 1.7, GreenData, 22:26, 15.06.2026, Россия401
Компания GreenData, российский разработчик low-code-платформы, подтвердила совместимость с операционной системой специального назначения Astra Linux Special Edition 1.7. Испытания подтвердили корректную работу платформы GreenData LTS.480.4 в среде Astra Linux SE 1.7.8.


DataSpace ввел в эксплуатацию новый контур публичного облака, DataSpace, 22:26, 15.06.2026, Россия402
Облачный провайдер DataSpace объявляет о масштабном расширении вычислительных мощностей и запуске нового сегмента публичного облака на базе собственного дата-центра TIER III Gold.


Пользователям «Альфа-Авто, ред. 6» стало доступно новое дополнение для интеграции с сервисом «Автобаза», 1С-Рарус, 22:26, 15.06.2026, Россия396
Для пользователей «Альфа-Авто, редакция 6» стало доступно новое дополнение для интеграции с сервисом «Автобаза». Дополнение автоматизирует обмен данными между «Альфа‑Авто» и системой расчета кузовного ремонта, ускоряет подготовку заказ‑нарядов и ремонтных документов.


Терминал сбора данных Chainway C66 поддерживает российскую мобильную операционную систему РЕД ОС М, ОКТРОН, 22:26, 15.06.2026, Россия397
Совместимость с РЕД ОС М позволяет использовать Chainway C66 в проектах, предъявляющих повышенные требования к технологической независимости и применению отечественного программного обеспечения


«Швабе» представил на «Флот-2026» системы наблюдения с элементами ИИ, Холдинг «Швабе» Госкорпорация Ростех, 22:26, 15.06.2026, Россия402
Холдинг «Швабе» Госкорпорации Ростех показал на Международном военно-морском салоне «Флот» передовые разработки в области всепогодного и круглосуточного визуального контроля обстановки.


Dialog Composer 3.0 от BSS: переход от скриптовых ботов к самостоятельным ИИ-агентам, BSS, 22:25, 15.06.2026, Россия407
Компания BSS дает мощный толчок развитию диалоговых интерфейсов с новой версией Dialog Composer 3.0. Ключевой особенностью релиза стала нативная поддержка архитектуры ИИ-агентов на базе больших языковых моделей (LLM). Обновленный no-code инструмент позволяет компаниям быстро внедрять автономных ИИ-ассистентов, существенно снижая нагрузку на контактные центры и операционные службы.


Hisense встречает Чемпионат мира по футболу FIFA 2026™ с инновационной технологией RGB MiniLED, Hisense, 22:22, 15.06.2026, Россия404
Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, являясь официальным спонсором турнира, приветствует старт Чемпионата мира по футболу FIFA 2026™.


Более 7000 заявок подали родительские комитеты на конкурс Общества «Знание», Общество "Знание, 22:22, 15.06.2026, Россия403
Завершился прием заявок на третий сезон конкурса инициатив родительских сообществ. По итогам отбора более 7 тысяч инициатив по созданию воспитательных проектов в школах, колледжах и детских садах подали родительские комитеты из 88 регионов России.


TCL представляет SQD-Mini LED — новое поколение технологии изображения для премиальных телевизоров, TCL, 22:21, 15.06.2026, Россия396
TCL представляет SQD-Mini LED — новое поколение технологии отображения, разработанное для современных сценариев просмотра. Технология объединяет высокую точность регулировки яркости, технологию квантовых точек Super QLED и фильтр Ultra Color, обеспечивая более точное управление яркостью, расширенную цветопередачу и высокую детализацию изображения.


Новинки промышленного электрооборудования Dekraft: модульные автоматические выключатели ВА-203, АРМО-СИСТЕМЫ, 22:19, 15.06.2026, Россия401
Компания «Систэм Электрик» расширила ассортимент модульного оборудования бренда Dekraft, добавив в нее автоматические выключатели ВА-203 промышленного класса с отключающей способностью 15 кА и номинальными токами от 6 до 100 А


Flyvi выпустил первое в России мобильное приложение, объединившее профессиональный дизайн и генеративный ИИ. Импортозамещение Canva состоялось на смартфонах, Flyvi, 22:19, 15.06.2026, Россия406
Пока конкуренты предлагают разрозненные сервисы, которые доступны только с десктопов, Flyvi упаковал полноценный графический редактор, нейросети для видео, текста и изображений в единую экосистему, доступную в один тап.


В iSpring LMS теперь можно создавать курсы с помощью ИИ, iSpring, 22:17, 15.06.2026, Россия406
Компания iSpring, разработчик решений для корпоративного обучения, обновила платформу iSpring LMS. В системе появилась функция создания курсов с помощью искусственного интеллекта в лонгридах.


«ИНКА 4.0» создала полигон для тестирования MES-систем в промышленности, Инка, 22:17, 15.06.2026, Россия415
Компания «ИНКА 4.0» развернула цифровой полигон для тестирования и апробации MES-систем в условиях, приближенных к промышленной эксплуатации. Это позволит предприятиям заранее оценить их работу и принять решение о внедрении, а интеграторам и центрам компетенций заказчиков получить практический опыт работы с системой и ее компонентами.


  © 2003-2026 inthepress.ru