Пресс-релизы // » Добавить пресс-релиз

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group
Компания: UDV Group
Добавлен: 23:26, 06.04.2026 Количество просмотров: 44
Страна: Россия


В Москве пройдет конференция «Распределенный финтех и Web3‑инфраструктура России», Web3 Tech, 23:35, 06.04.2026, Россия42
22 апреля 2026 г. в Москве состоится конференция «Распределенный финтех и Web3‑инфраструктура России».


Versta.io запускает отраслевое решение по перевозке опасных грузов, Versta, 23:35, 06.04.2026, Россия45
Цифровой логистический оператор versta.io внедрил в «Личном кабинете» специализированное отраслевое решение для работы с опасными грузами.


Закат эпохи имитаторов: заказчику нужен не просто качественный продукт, а продукт от качественного вендора, ИВК, 23:29, 06.04.2026, Россия46
6 апреля 2026 г., Москва


Как члену СНТ заключить договор с энергосбытом быстро и без проблем, ООО "Орловский энергосбыт", 23:27, 06.04.2026, Россия41
Как заключить договор на оплату электроэнергии для члена СНТ?


С ключевым доходом: «Выберу.ру» подготовил рейтинг вкладов с плавающей ставкой за март 2026 года, Финансовый маркетплейс "Выберу.ру", 23:22, 06.04.2026, Россия24
Вклады с плавающими ставками, в привязке к «ключу» ЦБ, весной позволяют людям зарабатывать доход выше среднерыночного по другим срочным депозитам. Поэтому «Выберу.ру» составил рейтинг банков с наиболее привлекательными условиями вкладами с переменными процентами. Топ-подборка поможет вкладчикам найти выгодный вариант, чтобы прибылью сбережений перекрыть официальную инфляцию.


ИТ-компания TYMY разработала инструмент продвинутой аналитики для партнёров SaaS-платформы, TYMY, 15:43, 03.04.2026, Россия373
На 2026 в компании запланировали релиз новых продвинутых аналитических инструментов и отдельных продуктов, для управления партнерскими сетями с использованием возможностей искусственного интеллекта. Одним из них стал инструмент управленческой аналитики партнерских каналов в режиме реального времени.


Innostage, КГЭУ и ПЭИПК договорились о совместной подготовке кадров для ТЭК, Innostage, 15:41, 03.04.2026, Россия369
В рамках международного электроэнергетического форума «Энергопром» компания Innostage, Петербургский энергетический институт повышения квалификации и Казанский государственный энергетический университет подписали меморандум о партнерстве в сфере подготовки кадров для топливно-энергетического комплекса.


ЭТП «Торги223»: на рынке закупок по 223-ФЗ появился первый ИИ-ассистент для заказчиков, АО «Центр развития электронных торгов» (оператор ЭТП «Торги223»), 15:32, 03.04.2026, Россия369
АО "ЦРЭТ" объявляет о запуске полнофункционального AI-ассистента для заказчиков в сегменте закупок по 223-ФЗ.


ГКX-Com проводит СКС, видеонаблюдение и кондиционирование в офисе АО «ДРАГА» в Москве, ГК X-Com, 15:30, 03.04.2026, Россия380
ГК X-Com, многопрофильный системный интегратор, завершает проект по техническому оснащению офиса АО «ДРАГА», одной из ведущих российских компаний-регистраторов, которая предоставляет услуги в области ведения реестров владельцев ценных бумаг.


«1С-Рарус» провел реинжиниринг процессов пищевого производства «Пижанка», 1С-Рарус, 15:30, 03.04.2026, Россия366
«1С-Рарус» завершил проект автоматизации «Пижанка» из Йошкар-Олы. Производство и магазины работают в единой системе «1С:Управление предприятием 3.0», что сократило ручные операции в цехе в 3–5 раз, ускорило приемку товара в 2 раза и улучшило планирование и контроль.


Подтверждена совместимость Indeed MFA с продуктами C-Терра, Индид, 15:30, 03.04.2026, Россия368
Индид, российский разработчик решений в области защиты айдентити, и «С-Терра СиЭсПи», ведущий производитель средств сетевой информационной безопасности, в рамках технологического сотрудничества успешно провели тестирование на совместимость облачного сервиса многофакторной аутентификации Indeed MFA с решениями «С-Терра Шлюз» и «С-Терра Клиент» для организации защиты каналов и контролируемого защищенного подключения удаленных пользователей.


IDX представила новые инструменты предотвращения цифрового мошенничества на Форуме МФО Весна 2026, IDX, 15:30, 03.04.2026, Россия405
Решения IDX помогают микрофинансовым организациям бороться с фродом и обеспечивать безопасность клиентов.


Российская компания DST Global представила мессенджер нового поколения DST App, ДСТ Глобал, 15:22, 03.04.2026, Россия98
1 апреля 2026 года российская компания DST Global анонсировала запуск мессенджера нового поколения — DST App. Это коробочное решение для защищённых коммуникаций в организациях, сообществах и для личного использования.


Насчёт дохода повыше. «Выберу.ру» подготовил рейтинг лучших накопительных счетов за март 2026 года, Финансовый маркетплейс "Выберу.ру", 15:22, 03.04.2026, Россия84
«Выберу.ру» составил рейтинг банков с наиболее выгодными для вкладчиков сберегательными продуктами по максимальным ставкам. Топ-подборка поможет людям в апреле получать доход выше, чем по вкладам.


Обновленный NLU Suite от BSS-AI позволяет бизнесу сократить время вывода голосовых помощников, BSS, 15:22, 03.04.2026, Россия148
Релиз ориентирован на комплексное ускорение подготовки данных и расширение аналитических возможностей при работе с тремя типами проектов: адаптацией речевых моделей (ASR), моделей понимания языка (NLU) и больших языковых моделей (GAI/LLM).


  © 2003-2026 inthepress.ru