 |
Zero-shot: как обучить виртуального ассистента без данных
Чем больше доступных данных для обучения моделей, тем легче создать ML модель с высоким качеством. Однако, при изучении новых или редких явлений данные могут отсутствовать или быть в ограниченном количестве. Кроме того, даже если данные имеются в необходимом количестве, на их подготовку может не хватать времени или ресурсов. Так возникла идея минимизировать затраты на обучение моделей, используя новый способ подготовки данных — обобщение множества категорий. Тогда появились методы ML, распознающие новые классы с помощью нескольких обучающих примеров (Few-Shot Learning) или одного примера (One-Shot Learning). Zero-shot обучение или «обучение без примеров» подразумевает способность искусственного интеллекта осваивать новые задачи без обучения на конкретных примерах. Вместо примеров необходимо описать тематику и подготовить вспомогательную информацию. Например, для обучения модели тематике «Баланс карты» нужно расписать все запросы, связанные с целью узнать баланс карты или остаток по счету. Использование Zero-shot актуально при запуске проектов, когда у заказчика нет реальных данных для обучения модели или нет времени на подготовку данных. Ранее в таких ситуациях аналитики применяли синтетические данные, то есть искусственно созданные и имитирующие реальность. Модели, обученные методом Zero-shot, не уступают в качестве моделям, использующие синтетические данные. К тому же обучение на основе Zero-shot происходит значительно быстрее, т.к. нужно создать описание тематик, а не выдумывать искусственные примеры. Для создания стартовой версии робота достаточно списка интентов (намерений, с которыми клиенты будут обращаться к голосовому помощнику) и их описание. Модели на базе технологии Zero-shot используются в начале проектов, когда реальные данные для обучения ещё не собраны или отсутствуют. Это позволяет оперативно запустить первую версию виртуального ассистента. Следующие версии уже обучаются на реальных данных, собираемых в ходе общения робота с пользователями. «Несмотря на то, что Zero-shot пока не может заменить обучение на примерах реальных реплик, использование этой технологии помогает обучать робота новым тематикам за часы (а иногда и минуты) с тем, чтобы после быстрого запуска нового навыка, собрать реальные реплики и обучить более тяжелую и качественную модель», – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа
Компания: BSS
Добавлен: 22:37, 04.04.2024
Количество просмотров: 183
Страна: Россия
Виталий Лейбин и "Практики созидания" ищут юные таланты для нового медиапроекта о счастье, Живые города, 08:38, 29.05.2025, Россия314 |
Общероссийский проект «Практики созидания» и команда Виталия Лейбина запускают летнюю медиалабораторию и всероссийский конкурс медиапроектов «Что такое счастье?»
Инициатива направлена на активное вовлечение школьников и молодежи в исследовательскую журналистику, а также развитие профессиональных навыков в создании качественного медиаконтента. |
Сервисы «Телфин» интегрированы с CRM-системой S2, Телфин, 22:34, 27.05.2025, Россия227 |
Провайдер коммуникационных сервисов «Телфин» совместно с командой разработчиков S2 завершили интеграцию виртуальной АТС «Телфин.Офис» с российской системой S2. Пользователи сервисов могут контролировать качество обслуживания клиентов, не выходя из CRM. |
«Бастион» — платиновый партнер «Кода Безопасности», «Бастион», 22:32, 27.05.2025, Россия228 |
Компания по информационной безопасности «Бастион» получила статус Platinum Partner разработчика ИБ-средств «Код Безопасности». Он подтверждает компетенции компании в части поставки, внедрения и поддержки решений, предназначенных для защиты виртуальной инфраструктуры, сетей передачи данных, рабочих станций и серверов. |
Суперкомпьютер на основе сервера Crusader установили в Ярославском техническом университете, STEP LOGIC, 22:31, 27.05.2025, Россия234 |
Суперкомпьютер для обучения ИИ-моделей появился в Ярославском государственном техническом университете. Применение современных вычислительных мощностей дает вузу возможность продуктивно работать с данными и увеличить скорость их обработки. Проект реализовала команда системного интегратора STEP LOGIC с использованием серверов Crusader от 3Logic Group. |
Фиджитех- новое имя лидера фиджитал-индустрии, ООО "Фиджитал технологии", 22:30, 27.05.2025, Россия233 |
Российский разработчик иммерсивных решений Hello I/O объявил о ребрендинге и смене названия на Фиджитех (Фиджитал Технологии). Обновление фирменного стиля стартовало в начале 2025 года. |
|
 |