Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 296
Страна: Россия


VolgaBlob и Крайон стали партнерами, VolgaBlob, 22:35, 05.03.2026, Россия57
Российский разработчик решений для кибербезопасности VolgaBlob и ИТ-интегратор технологических решений Крайон заключили партнерское соглашение. Крайон выступит реселлером и интегратором системы мониторинга Smart Monitor, предназначенной для зонтичного ИТ-мониторинга, построения SOC/SIEM и анализа бизнес-процессов.


CPS-2026: техника, с которой рынок будет работать завтра, CPS, 22:51, 05.03.2026, Россия149
Зона ЭКСПО на CPS-2026 – это срез рынка. За три дня на одной площадке собирается техника и технологии, с которыми продакшны, студии и телеканалы будут работать в ближайшие сезоны.


GMONIT усиливает устойчивость цифровых сервисов: платформа включена в реестр ПО в сфере ML, GMONIT, 22:49, 05.03.2026, Россия148
Observability платформа получила новую запись в Едином реестре российского ПО Минцифры. Инструмент позволяет бизнесу сократить время поиска первопричин инцидентов, заранее выявлять зоны риска и находить закономерности в собранных данных.


СиСофт Девелопмент: десятки преподавателей московских строительных колледжей стали настоящими ТИМ-лидерами, СиСофт Девелопмент», 22:49, 05.03.2026, Россия153
Москва, 05 марта 2026 года.


Технологическая синергия и операционная эффективность: «Группа Астра» выводит на рынок решение для защиты данных в виртуальных средах, "Группа Астра", 22:48, 05.03.2026, Россия150
Заказчики получают готовый продукт, где две зрелых разработки работают как единое целое, что исключает необходимость самостоятельной сборки компонентов и сокращает сроки внедрения.


Доверенная операционная система и современные средства защиты: Astra Linux и Dallas Lock прошли испытания, "Группа Астра", 22:47, 05.03.2026, Россия154
Интеграция позволяет заказчикам формировать защищенные контуры на базе проверенной комбинации отечественных продуктов и масштабировать инфраструктуру без дополнительных рисков.


За месяц росгвардейцы изъяли у граждан 55 единиц оружия, Управление Росгвардии по Орловской области, 22:46, 05.03.2026, Россия162
В течение прошедшего месяца сотрудники подразделений лицензионно-разрешительной работы Управления Росгвардии по Орловской области приняли от граждан 1044 заявления по вопросам предоставления государственных услуг.


Экспертиза уровня Trusted Advisor и технологии ИИ: ГК ALMA представит стратегию цифровой трансформации на «Нефтегаз-2026», ALMA, 22:42, 05.03.2026, Россия153
ИИ для ТЭК: ALMA на выставке «Нефтегаз-2026» ГК ALMA приглашает на свой стенд (Павильон 2, зал 8, 8B015), где покажет будущее цифровой нефтедобычи.


UDV Group: как распознать цифрового преследователя и защитить себя в Сети, UDV Group, 22:41, 05.03.2026, Россия158
Онлайн-преследование все чаще выходит за рамки безобидного интереса. Кто-то внимательно следит за обновлениями в соцсетях, кто-то создает фейковые аккаунты и копирует ваши фото, а кто-то не останавливается даже перед угрозами.


«НЕКСТБИ» расширила инструментарий собственной платформы, Некстби, 22:41, 05.03.2026, Россия161
Компания «НЕКСТБИ» реализовала в составе одноимённой интеграционной платформы модуль продвинутого управления инфраструктурой – PMSS (Platform Management Subsystem).


Web3 Tech подвела итоги 2025 года: рост выручки на 70% и фокус на формирование инфраструктуры для регулируемого крипторынка, Web3 Tech, 22:40, 05.03.2026, Россия162
Компания Web3 Tech, разработчик корпоративных блокчейн-решений и провайдер web3-сервисов, по итогам 2025 года зафиксировала рост выручки на 70%.


Компания «ЭлНетМед» запустила подписание документов с пациентами через мессенджер MAX, ЭлНетМед, 22:40, 05.03.2026, Россия224
Компания «ЭлНетМед», разработчик интеграционной платформы N3.Health, запустила подписание электронных документов через национальный мессенджер MAX в рамках собственного сервиса N3.Health СЭП, сервис электронного подписания.


Обновление low-code решения «БФТ.Платформа»: новый модуль МЧД, многоэкранный режим, улучшение эргономики и настроек интерфейса, БФТ-Холдинг, 22:40, 05.03.2026, Россия156
БФТ-Холдинг расширяет возможности low-code решения «БФТ.Платформа». Последние обновления дают возможность пользователям работать с несколькими документами одновременно, гибко настраивать представление данных, снижают риски при моделировании процессов и соответствуют требованиям закона об электронной подписи.


Zunami Брокер: что маркетплейсы ждут от страхования в 2026 году, Страховой Брокер "Цунами", 22:39, 05.03.2026, Россия187
Zunami Брокер традиционно стал участником XIV Международной Конференции Страховых Брокеров, организованной Ассоциацией Профессиональных Страховых Брокеров, 18 февраля


Группа ПАО «НМТП» переводит ИТ-инфраструктуру на российские решения «Гравитон», Гравитон, 22:35, 05.03.2026, Россия135
Российский производитель вычислительной техники «Гравитон» и Группа ПАО «НМТП» успешно запустили в эксплуатацию геораспределенный вычислительный кластер на базе российского программно-аппаратного комплекса виртуализации Helius.


  © 2003-2026 inthepress.ru