Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 277
Страна: Россия


Затраты бизнеса на кибербезопасность в 2026 году продолжат расти, UDV Group, 22:42, 23.01.2026, Россия97
Расходы коммерческих компаний и госорганизаций на информационную безопасность (ИБ) в следующем году увеличатся, но изменится их структура.


Производитель упаковки NOVAROLL автоматизировал кадровый ЭДО с помощью HRlink, HRlink, 22:42, 23.01.2026, Россия102
Группа компаний NOVAROLL полностью отказалась от бумаги в кадровом делопроизводстве и перевела в электронный формат более 5 000 сотрудников — от рабочих производственных площадок до иностранных граждан.


«DатаРу Технологии» расширила линейку серверов новым решением «ДатаРу ХФ5298», ДатаРу, 22:42, 23.01.2026, Россия95
Отечественный производитель серверного и сетевого оборудования «DатаРу Технологии» обновил линейку серверов под хранение данных, дополнив ее новой моделью «ДатаРу ХФ5298».


«Скорозвон» вошёл в рейтинг крупнейших и быстрорастущих поставщиков SaaS в России по версии CNews Analytics, Сервис «Скорозвон», 22:40, 23.01.2026, Россия107
Облачный сервис «Скорозвон» вошёл в рейтинг крупнейших поставщиков SaaS в России по версии CNews Analytics. В 2023–2024 годах выручка компании выросла на 49,72%, демонстрируя значительную динамику развития.


Компания GMONIT выпустила обновление в observability платформе, ускоряющее устранение ошибок, GMONIT, 22:37, 23.01.2026, Россия105
Российский разработчик расширил возможности observability платформы GMONIT, направленной на сокращение времени простоя бизнес-систем. Новый модуль консолидирует все ключевые телеметрические данные в одном интерфейсе, минимизирует необходимость работы с десятками дашбордов и ускоряет устранение инцидентов.


Toshiba TV продемонстрировала усовершенствованную платформу REGZA Intelligence на выставке CES 2026, Toshiba TV, 22:31, 23.01.2026, Россия93
Модернизация звука, изображения и поиска контента с помощью ИИ


CorpSoft24 создала сервис для обезличивания документов при работе с нейросетями, CorpSoft24, 22:28, 23.01.2026, Россия62
Компания CorpSoft24 и ее лаборатория инноваций CorpLab разработали прототип сервиса для автоматической анонимизации данных. Решение позволит сотрудникам компаний использовать внешние ИИ-сервисы, такие как ChatGPT, без риска утечки персональных данных и коммерческой тайны.


Прикладное ПО «HMISKO» от «НЭК.ТЕХ» внесено в реестр Минцифры, ООО "НЭК ТЕХ", 22:27, 23.01.2026, Россия63
Разработанное научно-техническим центром «НЭК.ТЕХ» (входит в Группу «НЭК») прикладное ПО «HMISKO», предназначенное для использования совместно с устройствами УПАСК ПКУС СКО в системах автоматизации, контроля и мониторинга промышленных и энергетических объектов, внесено в Единый реестр российского программного обеспечения.


Платформа Optimacros стала лидером исследования «Созвездие IBP 2025» от «Технологий Доверия», Оптимакрос, 22:26, 23.01.2026, Россия63
Компания «Технологии Доверия» (ex-PwC) провела исследование российского рынка IBP-систем. Аналитики ТеДо рассмотрели ключевые отечественные программные продукты в классе Integrated Business Planning, оценили их функциональные возможности и стратегию развития.


«Платформа Боцман» признана лучшей российской Kubernetes-платформой для ИИ и машинного обучения, "Группа Астра", 22:25, 23.01.2026, Россия69
Рейтинг представлен в рамках масштабного обзора, посвященного российским решениям для оркестрации, предназначенным специально для создания, развертывания и управления приложениями машинного обучения.


Hisense приняла участие в выставке CES 2026, Hisense, 22:24, 23.01.2026, Россия62
Hisense, один из ведущих мировых производителей телевизионной и бытовой техники, подводит итоги участия в выставке CES 2026, которая с 6 по 9 января состоялась в Лас-Вегасе (штат Невада, США). Компания представила ряд новых, в том числе революционных, технологий и удостоилась почетных наград.


«Агроэко» повысил компетенции сотрудников в области ИИ с помощью команды Axenix, Axenix, 22:20, 23.01.2026, Россия56
Российский агропромышленный холдинг «Агроэко» продолжает планомерную реализацию стратегии цифровой трансформации.


Verme завершила обновление WFM-системы и программы учета рабочего времени, Verme, 22:19, 23.01.2026, Россия55
Компания Verme, разработчик решений для повышения эффективности линейного персонала, обновила два флагманских продукта. WFM-система получила улучшенный пользовательский интерфейс, а программа учета рабочего времени – возможность бесперебойной работы при проблемах с интернетом и дополнительную защиту от фрода.


От контроля к управлению: у систем управленческой отчетности появляется новый функционал, Некстби, 22:18, 23.01.2026, Россия146
Возможности ИТ-систем для автоматизации управленческой отчетности в России сегодня активно расширяются.


Бастион подтвердил экспертизу в защите облачных и гибридных сред, Бастион, 22:15, 23.01.2026, Россия50
Компания по информационной безопасности «Бастион» получила специализацию в рамках партнерской программы «Лаборатории Касперского» — Cloud Workload Protection (CWP). Новый статус подтверждает опыт компании в обеспечении комплексной безопасности облачных инфраструктур и сред разработки.


  © 2003-2026 inthepress.ru