Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 400
Страна: Россия


DатаРу представила новый сервер для задач развития искусственного интеллекта, ДатаРу, 16:12, 20.06.2026, Россия214
Российский вендор технологических решений и сервисов DатаРу выпустил на рынок новый сервер «ДатаРу XE9785», ориентированный на выполнение ресурсоемких задач в области искусственного интеллекта.


От разговоров об ИИ к практическому применению: как прошёл первый поток курса VAP: Применение ИИ в ITSM и ESM, Cleverics, 16:11, 20.06.2026, Россия235
В Cleverics подвели итоги первого потока курса по применению искусственного интеллекта в сервис-менеджменте. Ключевая задача программы заключалась не в обучении программированию, а в том, чтобы дать специалистам практический инструментарий для внедрения ИИ и ответить на главный вопрос бизнеса: «с чего начать и будет ли от этого толк».


МегаФон ускорит интернет на «Пикнике Афиши», МегаФон, 16:10, 20.06.2026, Россия213
Оператор обеспечит высокоскоростным мобильным интернетом десятки тысяч гостей фестиваля «Пикник Афиши», который пройдёт 20 июня в музее-заповеднике «Коломенское».


В МГППУ прошла кросс‑вузовская экспертиза в рамках реализации программы развития «Приоритет – 2030», Московский государственный психолого-педагогический университет, 15:37, 20.06.2026, Россия163
Стратегическая цель Университета направлена на достижение лидерства в области психолого-педагогического образования


Производительность труда и здоровье: от пилота к масштабированию!, Нобилис ООО, 16:07, 20.06.2026, Россия230
Ивановская область может стать инновационным регионом в автоматизации диспансеризации!


«ГИГАНТ — Компьютерные системы» о том, почему Drama RAT опасен не только для банковских счетов, ГИГАНТ, 15:57, 20.06.2026, Россия209
Эксперт «ГИГАНТ — Компьютерные системы» объяснил, как Drama RAT получает контроль над смартфоном, почему его сложно обнаружить статическим анализом и чем заражение личного телефона может угрожать компании


«1С-Рарус» в Нижнем Новгороде подтвердил статус «Центр сопровождения 1С», 1С-Рарус, 15:56, 20.06.2026, Россия217
По результатам аудита нижегородский офис «1С‑Рарус» подтвердил статус «Центр сопровождения программ и информационных продуктов фирмы „1С“». Клиенты «1С-Рарус» получают рекомендованный фирмой «1С» уровень сервиса: регулярные обновления, консультации и поддержку по программам «1С:Предприятие» и сервисам 1С:ИТС.


ЯрПАПА шагает по стране 2026, АНО "Содружество семей", 15:56, 20.06.2026, Россия206
Автономная некоммерческая организация «Содружество семей» совместно с Региональным отделением Всероссийского общественного движения «ОТЦЫ РОССИИ» Ярославской области объявляют о начале приема заявок на участие во Всероссийском конкурсе семейных видеороликов «ЯрПАПА шагает по стране-2026».


Платформа Optimacros представлена на карте CNews Analytics «Импортозамещение в банках 2026», ООО "Оптимакрос", 15:51, 20.06.2026, Россия213
Агентство CNews Analytics выпустило обновленную инфографику «Импортозамещение в банках 2026» и включило CPM/IBP-платформу Optimacros в раздел «Управление ликвидностью, казначейством и бюджетирование».


«Выберу.ру»: накопительный счёт МТС Банка — лидер рейтинга в июне 2026 года, Финансовый маркетплейс "Выберу.ру", 15:51, 20.06.2026, Россия204
МТС Банк возглавил рейтинг крупнейших банков страны по итогам исследования «Выберу.ру» «Лучшие накопительные счета в июне 2026 года».


Space расширяет региональное присутствие: в Самаре открылся новый офис компании, ДАКОМ М, 15:50, 20.06.2026, Россия206
«ДАКОМ М» (бренд Space), российский разработчик программного обеспечения и R&D-центр, открыл новый офис в Самаре.


ТЦ «Муравей» приглашает на дегустацию летних новинок от кофе-бара «Кофелайк», тц муравей, 15:49, 20.06.2026, Россия65
Торговый центр «Муравей» продолжает радовать посетителей яркими событиями и гастрономическими открытиями!


GreenData подключила ИИ-ассистентов к корпоративным системам через MCP, GreenData, 15:47, 20.06.2026, Россия68
GreenData расширила возможности конструктора корпоративных ИИ-ассистентов GreenBox. Конструктор GreenBox теперь позволяет работать с Jira, GitLab и другими внешними сервисами, а также запускать процессы и создавать объекты непосредственно в low-code платформе.


Minervasoft назвала пять ошибок в работе с корпоративными знаниями при внедрении ИИ-ассистентов, Minervasoft, 15:47, 20.06.2026, Россия106
Более 80% компаний среди крупного и среднего бизнеса допускают критичные ошибки в работе с корпоративными знаниями. Это приводит к увеличению нагрузки на сотрудников и становится стоп-фактором при внедрении ИИ-ассистентов, следует из результатов проведенных Minervasoft аудитов.


«Первый Бит» развернул защищенную BI-аналитику в закрытом контуре машиностроительной компании «Диполь», Первый Бит, 15:46, 20.06.2026, Россия68
Время подготовки отчетности сократилось с 1-2 дней до 10-15 минут, а бизнес-пользователи стали на 60% чаще выводить нужные отчеты самостоятельно.


  © 2003-2026 inthepress.ru