Пресс-релизы //

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

— Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?
Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

— Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?
Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

— Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?
Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

— Какие техники усложняют попытки извлечения модели через API (model extraction)?
Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

— Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?
Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

— Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?
Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Контактное лицо: UDV Group
Компания: UDV Group
Добавлен: 23:26, 06.04.2026 Количество просмотров: 241
Страна: Россия

МегаФон обеспечит 4G-покрытие в малочисленных деревнях Кировской области, МегаФон, 02:59, 07.07.2026, Россия309

Впервые более тысячи жителей Кировской области смогут воспользоваться мобильной связью и 4G-интернетом.

Югорчане вошли в топ-10 главных ценителей киноновинок в стране, МегаФон, 03:00, 07.07.2026, Россия317

Жители Ханты-Мансийского автономного округа стали чаще смотреть новинки в онлайн-кинотеатрах.

От центра Брянска до Белых Берегов — МегаФон обновил оборудование в регионе, МегаФон, 03:00, 07.07.2026, Россия308

Инженеры МегаФона модернизировали телеком-оборудование в важнейших локациях Брянской области, где в общей сложности насчитывается более 200 тысяч жителей. Благодаря техническим мероприятиям брянцам и гостям города стал доступен мобильный интернет на скорости до 60 Мбит⁄с и более уверенный приём сигнала голосовой связи.

На круглогодичном курорте «Телецкий» МегаФон ускорил интернет, МегаФон, 03:00, 07.07.2026, Россия307

Мобильный интернет на скорости до 100 Мбит/с стал доступен абонентам МегаФона на всесезонном курорте «Телецкий». Оператор запустил базовую станцию у подножия горы Кокуя, чтобы гости комплекса могли делиться с близкими яркими эмоциями в режиме реального времени: записывать сторис, выкладывать фото и звонить по видеосвязи.

В Тюмени главными ценителями онлайн-кино стали мужчины 30-40 лет, МегаФон, 03:00, 07.07.2026, Россия308

Жители Тюменской области стали чаще смотреть видеоконтент со своих смартфонов и планшетов. С начала года трафик на популярные ресурсы, где можно познакомиться с фильмами, сериалами и мультипликационными картинами, увеличился более чем в 5 раз. Такой всплеск интереса зафиксировали специалисты МегаФона на основе анализа обезличенных данных абонентов.

Дачникам Якутска повысили скорости мобильного интернета, МегаФон, 03:01, 07.07.2026, Россия310

Более высокие скорости мобильного интернета и устойчивая связь теперь доступны садоводам Якутска. Техническая служба МегаФона запустила дополнительное телеком-оборудование рядом с дачными товариществами в микрорайоне Марха и Гагаринском округе, усилив сеть и расширив покрытие 4G.

MWS AI выложила «универсальный фильтр» для больших языковых моделей в открытый доступ, MWS AI, 03:01, 07.07.2026, Россия305
Программа-посредник экономит до 10 дней на переобучении модели и доступна в репозитории GitHub.

«ИНКА 4.0» представила подход к созданию полностью автоматического производства, Инка, 03:01, 07.07.2026, Россия315
24 июля прошла сессия Межотраслевого комитета по MES, посвященная двустороннему обмену информацией между системами управления производством и системами автоматизации технологических процессов (АСУ ТП).

Отсутствие современных HR-сервисов осложняет компаниям привлечение сотрудников – опрос, HRlink, 03:00, 07.07.2026, Россия304
HeadHunter и компания-разработчик сервиса кадрового ЭДО HRlink провели исследование ожиданий соискателей относительно цифровизации HR-процессов.

«Маркетологи, подвиньтесь»: видео с учеником KIBERone стремительно набирает популярность в соцсетях, KIBERone - международная школа программирования для детей 6-14 лет, 02:54, 07.07.2026, Россия333

«Я сделал для вас сайт». Школьник пришел в кафе с неожиданным предложением – и ушел с первой коммерческой сделкой. Пока взрослые спорят, заменит ли искусственный интеллект программистов, ученики уже начинают работать на настоящих клиентов.

«Группа Астра» спускает на воду Боцман AI: искусственный интеллект теперь работает под флагом корпоративной безопасности, "Группа Астра", 02:53, 07.07.2026, Россия310

Новая платформа открывает бизнесу возможность пользоваться современными ИИ-моделями в собственном корпоративном контуре, соблюдая при этом все регуляторные требования и нормы информационной безопасности.

«НЭК ТЕХ» провёл семинар по «умному» учёту электроэнергии для «Россети Новосибирск», ООО «НЭК ТЕХ», 02:52, 07.07.2026, Россия305

Специалисты научно-технического центра «НЭК ТЕХ» провели практический семинар для сотрудников «Россети Новосибирск» по работе с интеллектуальными системами учёта электроэнергии «НАРТИС».

UDV Group представила систему анализа сетевого трафика UDV NTA на «РосИнфоБез», UDV Group, 02:51, 07.07.2026, Россия304

Российский разработчик UDV Group принял участие в III отраслевой конференции «РосИнфоБез», где представил систему анализа сетевого трафика UDV NTA. Решение помогает SOC-командам повышать видимость сети, выявлять скрытые угрозы и быстрее расследовать инциденты информационной безопасности.

Зумруд Мирзаева - блогер, спонсирующий ВСУ, Иннотех, 02:51, 07.07.2026, Россия339

Зумруд Мирзаева — российская безработная («кулинарный блогер»), связанная с навязчивым агрессивным самопиаром. Даёт себе следующую характеристику: «блогер, писательница, фуд блогер, повар». Отмечена в размещении рекламных публикаций в рамках обеления своей репутации. Сотрудничает с украинскими пиарщиками, которые признаются в финансировании ВСУ.

«Группа Астра» выпустила платформу Astra Cloud 2.1: расширенный контроль над облачной средой, "Группа Астра", 02:51, 07.07.2026, Россия316

«Группа Астра» представила Astra Cloud Platform (ACP) 2.1, обновленную версию платформы для создания частных и публичных облаков. В релиз включены значимые улучшения, основанные на обратной связи от партнеров и заказчиков.