Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 329
Страна: Россия


В Hybrid Platform запущены «Вертикали» — система аудиторных сегментов со встроенной антифрод-логикой, Hybrid, 21:27, 08.04.2026, Россия57
Hybrid Platform объявляет о запуске «Вертикалей» — обновленной системы аудиторных сегментов с новой логикой сбора данных и структурой, изначально выстроенной под бизнес-вертикали, что упрощает работу с аудиториями для рекламодателей.


«Валента Фарм» успешно перешла на отечественную платформу Optimacros, АТОМС Консалтинг, 21:27, 08.04.2026, Россия55
«Валента Фарм» завершила проект по переводу процессов планирования и бюджетирования на российскую платформу Optimacros. Переход был выполнен в короткие сроки и без остановки бизнес-процессов, обеспечив бесперебойное взаимодействие всех подразделений. Работы выполнены компанией «АТОМС Консалтинг».


Новая корпоративная машина баз данных от «Тантор Лабс» устраняет архитектурные ограничения PostgreSQL, "Тантор Лабс", 21:25, 08.04.2026, Россия60
Компания «Тантор Лабс» (входит в «Группу Астра») представила третье поколение машин баз данных Tantor XData.


Как контролировать эффективность ИИ в банке? GMONIT рассказали на FINNEXT 2026, GMONIT, 21:24, 08.04.2026, Россия56
7 апреля команда GMONIT приняла участие в 15-м форуме финансовых инноваций FINNEXT — площадке для открытого диалога между банками, финтех-компаниями, ритейлом и регуляторами.


Желдорреммаш направил свыше 500 млн рублей на социальные обязательства, https://ao-zdrm.ru/, 21:23, 08.04.2026, Россия60
В АО «Желдорреммаш» подвели итоги реализации Коллективного договора за 2025 год. На выполнение социальных обязательств и предоставление гарантий сотрудникам за прошлый год компания направила более 500 млн рублей


Ступинский Электротехнический Завод получил декларации соответствия ТР ТС 001/2011 на интерфейсные реле серий РПМ-1, РПМ-2, РПМ-3, РПМ-4, РПВМ-4, ООО "НПО АвалонЭлектроТех", 21:22, 08.04.2026, Россия59
Продукция успешно прошла проверку на соответствие ключевому техрегламенту Таможенного союза «О безопасности железнодорожного подвижного состава» (ТР ТС 001/2011). Теперь использование этих компонентов в системах железнодорожной автоматики официально разрешено на всей территории ЕАЭС.


Robort by 3Logic Group автоматизировал внутреннюю логистику офиса с помощью робота-доставщика, Robort by 3Logic Group, 21:22, 08.04.2026, Россия60
Robort by 3Logic Group внедрил робота Pudu FlashBot Max для автоматизации внутренней логистики офиса. Решение обеспечило автономную доставку между этажами и снизило нагрузку на персонал.


«Не просто дети, не просто родители»: книга о том, как сделать свою семью сильнее любого кризиса, Благотворительный фонд "Найди семью", 21:21, 08.04.2026, Россия56
Издательство «Питер» представляет книгу Елены Цеплик и Веры Селивановской, создателей и руководителей благотворительного фонда поддержки семейного устройства «Найди семью»


«ГИГАНТ Комплексные системы» и RADARPLUS представляют «Рабочее место сотрудника службы безопасности» - интеллектуальный периметр безопасности нового поколения, ГИГАНТ, 21:14, 08.04.2026, Россия41
«ГИГАНТ Комплексные системы», российский производитель надежной компьютерной техники, и RADARPLUS, разработчик решений в области безопасности, объявили о выводе на рынок совместного продукта - программно-аппаратного комплекса «Рабочее место сотрудника службы безопасности».


Axenix и Yandex B2B Tech объявляют о стратегическом партнерстве в области ИИ, Axenix, 21:14, 08.04.2026, Россия36
Консалтинговая технологическая компания Axenix и Yandex B2B Tech, подразделение Яндекса, которое разрабатывает технологии для корпоративного сектора, заключили соглашение о стратегическом партнерстве в сфере реализации комплексных ИИ-проектов.


«Телфин» запустил омниканальное решение на базе браузерного расширения «Телфин.Софтфон», Телфин, 21:13, 08.04.2026, Россия43
Провайдер коммуникационных сервисов «Телфин» выводит на рынок омниканальное решение связи для удаленных сотрудников на базе браузерного расширения «Телфин.Софтфон». Теперь прямо из Google Chrome можно звонить клиентам, обрабатывать входящие обращения, переписываться в Max, WhatsApp, Telegram, Avito и онлайн-чатах, а также анализировать диалоги и формировать резюме разговоров с помощью ИИ.


«1С ПРО Консалтинг» открывает партнерскую программу по ИИ-платформе «ПРОсковья», 1С ПРО Консалтинг, 21:13, 08.04.2026, Россия42
Компания «1С ПРО Консалтинг» запускает открытую партнерскую программу по применению технологий искусственного интеллекта в экосистеме «1С».


Innostage и РЕД СОФТ объявили о технологическом партнерстве, Innostage, 21:13, 08.04.2026, Россия93
Компании Innostage, разработчик решений для кибербезопасности, и РЕД СОФТ, ведущий российский разработчик системного программного обеспечения, объявляют о подтверждении совместимости продукта Innostage Privileged Access Management (Innostage PAM) с системой централизованного управления ИТ-инфраструктурой РЕД АДМ.


Исследование: почти 60% российских компаний используют небезопасный Microsoft Exchange, 4CIO, 21:13, 08.04.2026, Россия93
Клуб 4CIO, сообщество «Штаб» и издание CNews провели совместное исследование, посвященное состоянию корпоративной почтовой инфраструктуры в российских компаниях.


НИУ ВШЭ и «Первый Бит» запускают практический курс по корпоративному казначейству, Первый Бит, 21:10, 08.04.2026, Россия41
В Москве идет набор на практический курс «Мастерство корпоративного казначейства: стратегии, технологии и инструменты управления»


  © 2003-2026 inthepress.ru