Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 372
Страна: Россия


МегаФон и Gelarm повысят устойчивость частных LTE-сетей, МегаФон, 18:12, 18.05.2026, Россия83
МегаФон и Gelarm в рамках ЦИПР-2026 подписали соглашение о внедрении российской системы GIMS Monitoring в проекты Private LTE/5G МегаФона. Решение представляет собой единый инструмент, способный заменить ряд зарубежных систем мониторинга и обеспечить сквозной контроль за состоянием сети и ИТ-сервисов.


Компания GMONIT подвела итоги 2025 года: рост выручки в 3,6 раза и укрепление позиций на рынке Observability, GMONIT, 18:19, 18.05.2026, Россия84
Разработчик российской Observability платформы GMONIT подвел финансовые итоги 2025 года. Выручка компании достигла 398 млн руб., что в 3,6 раза превышает показатель предыдущего года. Прирост составил 286 млн руб. по сравнению с 2024 годом.


ПАК Helius от «Гравитон» получил поддержку ИИ-моделей для создания защищенных корпоративных решений, «Гравитон», 18:19, 18.05.2026, Россия85
«Гравитон», разработчик и производитель российской вычислительной техники, расширяет функциональные возможности своей гиперконвергентной платформы ПАК Helius. Обновленное решение теперь включает инструменты для развертывания и управления моделями искусственного интеллекта, что открывает перед корпоративными заказчиками новые перспективы в области автоматизации и глубокой аналитики данных в закрытом контуре.


Askona обновила приложение Askona Sleep и AI-ассистента для анализа сна, Askona, 18:19, 18.05.2026, Россия79
Компания Askona обновила приложение Askona Sleep для Apple-устройств и разработала ИИ сомнолога «Оксана 2.0», сделав акцент на практическом использовании данных о сне и поддержке пользователей в решении проблем со сном в формате диалога в реальном времени.


«Наносемантика» разработала интеллектуальную систему классификации обращений граждан для Министерства юстиции Российской Федерации, Наносемантика, 18:18, 18.05.2026, Россия83
«Наносемантика», ведущий российский разработчик решений на основе нейросетей, реализовала проект классификатора для обработки входящей корреспонденции и распределения обращений граждан между исполнителями для Минюста РФ. Система развернута в инфраструктуре заказчика и продолжает развиваться.


Как корпоративная благотворительность становится частью бизнеса: кейс Askona Life Group, Аскона, 18:15, 18.05.2026, Россия85
Благотворительный фонд “ПроДобро”, созданный в контуре Askona Life Group. По итогам 2025 года фонд направил на помощь подопечным и сотрудникам компании более 36,7 млн рублей, при этом ключевой акцент делает не на количестве акций, а на выстраивании устойчивой модели поддержки.


В Иркутской области стартовала программа по модернизации наружного освещения, Жилищно-коммунальная служба № 1 филиала ФГБУ «Центральное жилищно-коммунальное управление» Минобороны России по 12 ГУ МО, 18:14, 18.05.2026, Россия81
В рамках программы по повышению энергоэффективности и модернизации системы наружного освещения специалистами Жилищно-коммунальной службы № 1 филиала ФГБУ «Центральное жилищно-коммунальное управление» Минобороны России по 12 ГУ МО на территории Иркутской области проводятся работы по замене устаревших осветительных приборов на современные светодиодные.


МФК «Лайм-Займ» — в топ-10 самых популярных ресурсов МФО по среднемесячному числу визитов, МФК «Лайм-Займ», 18:13, 18.05.2026, Россия83
Аналитики портала Brobank опубликовали исследование — топ-10 самых популярных ресурсов МФО по среднемесячному числу визитов в I квартале 2026 года.


«1С-Рарус» внедрил кадровый электронный документооборот для 1 800 сотрудников заводов Solopharm, 1С-Рарус, 18:12, 18.05.2026, Россия79
«1С‑Рарус» перевел HR‑процессы одного из крупнейших фармацевтических производителей России в единый цифровой контур. Использование сервиса «1С:Кабинет сотрудника», интегрированного с ERP‑системой предприятия, вдвое ускорило оформление основных кадровых документов и значительно сократило трудозатраты службы персонала и линейных руководителей.


UDV Group: энергетику ждет комплексная перестройка ИТ-ландшафта, UDV Group, 00:11, 09.05.2026, Россия848
Перечень типовых отраслевых объектов критической информационной инфраструктуры (КИИ), утвержденный в феврале 2026 года распоряжением Правительства РФ № 360-р, сделал подход к защите КИИ более жестким. Теперь игнорирование документа грозит не только высокими штрафами, но и остановкой бизнеса.


Экономия — наше всё. «Выберу.ру» подготовил рейтинг карт с кешбэком на все покупки за апрель 2026 года, Финансовый маркетплейс "Выберу.ру", 00:11, 09.05.2026, Россия836
К сезону повышенных майских расходов «Выберу.ру» составил рейтинг банков с наиболее выгодными людям дебетовыми картами благодаря максимальному кешбэку в категории «на все покупки». Топ-подборка поможет найти универсальный карточный продукт, который позволит россиянам немного сэкономить в условиях растущих цен за счёт возврата бонусов.


Банк ЗЕНИТ поздравляет с Днём Победы, Банк ЗЕНИТ, 00:10, 09.05.2026, Россия910
Банк ЗЕНИТ поздравляет своих клиентов и всех россиян с важным для страны и для каждого из нас праздником — с Днём Победы.


«Аксиома-Софт» автоматизировала учет ювелирных изделий в Торговом доме «Культура Дома», ООО "АКСИОМА-СОФТ", 00:07, 09.05.2026, Россия849
«Аксиома-Софт» автоматизировала учет ювелирных изделий в Торговом доме «Культура Дома» с помощью модуля «АКСИОМА: Интеграция с ГИИС ДМДК». Решение упростило работу по нескольким юридическим лицам: автоматическое создание номенклатуры, договоров, спецификаций. Исключено дублирование операций, ускорена передача данных в ГИИС ДМДК. Оптимизирован учет поступлений, оптовых и розничных продаж для 10 пользователей.


Sitronics Group усилила защиту внешнего ИТ-периметра с помощью платформы ETM от CICADA8, CICADA8, 00:00, 09.05.2026, Россия892
Переход на новое решение позволил автоматизировать контроль за ИТ-ландшафтом и полностью ликвидировать «слепые зоны» в защите компании.


VolgaBlob представила Smart Monitor 6.0 с функциональностью для задач observability, ИИ-движком и модулем AI Security, VolgaBlob, 23:59, 08.05.2026, Россия836
Компания VolgaBlob обновила флагманскую платформу Smart Monitor, предназначенную для анализа бизнес-процессов, ИТ-мониторинга и построения SOC/SIEM.


  © 2003-2026 inthepress.ru