Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 301
Страна: Россия


3Logic Group и Justo Group поставили графические станции Raskat в «Колледж Петербургской моды», 3Logic Group, 22:24, 17.03.2026, Россия131
Компания 3Logic Group, дистрибьютор комплектующих и ИТ-решений, совместно с партнером Justo Group, дистрибьютором и интегратором ИТ-оборудования, реализовала проект по обновлению материально-технической базы Санкт-Петербургского государственного бюджетного профессионального образовательного учреждения «Колледж Петербургской моды» (СПб ГБ ПОУ КПМ).


Главное — долго без %. «Выберу.ру» составил рейтинг лучших кредитных карт за февраль 2026 года, Финансовый маркетплейс "Выберу.ру", 22:24, 17.03.2026, Россия134
«Выберу.ру» подготовил рейтинг банков с наиболее выгодными для заёмщиков кредитными картами благодаря максимальному льготному периоду, когда можно не платить проценты. Топ подборка поможет клиентам найти карту, чтобы ощутимо сэкономить на переплате.


Александр Прошин возглавил направление партнерских продаж в DатаРу, ДатаРу, 22:13, 17.03.2026, Россия130
Группа компаний DатаРу назначила Александра Прошина на должность руководителя направления партнерских продаж.


VOX: среднее время контакта с digital-рекламой сократилось почти в 2 раза, Hybrid, 22:13, 17.03.2026, Россия138
AI Vision-платформа VOX, входящая в AdTech-экосистему Hybrid, совместно с исследовательским центром «НейроБренд» и компанией «Логика Молока» провела нейроисследование рекламных плейсментов.


«Рейтинг Рунета»: только 12% специалистов полностью понимают, как работает новый сбор 3% на рекламу в интернете, Рейтинг Рунета, 22:11, 17.03.2026, Россия131
Сервис подбора диджитал-подрядчиков «Рейтинг Рунета» в партнерстве с Digital Club и юридической фирмой «Рунетлекс» провели исследование среди специалистов, работающих с рекламой в интернете: рекламодателей, агентств и юристов.


«1С-Рарус» приглашает на конференцию Russian Retail Show 2026, 1С-Рарус, 22:08, 17.03.2026, Россия134
«1С Рарус» приглашает на Russian Retail Show 2026. Компания выступит генеральным партнером секции «Развитие ИИ инициатив и новые идеи применения AI технологий», расскажет о собственных AI решениях на базе 1С для ритейла. На стенде будет представлена линейка продуктов для автоматизации учета, управления лояльностью и анализа посетителей.


Вышел новый Astra Configuration Manager 1.6 с усиленной безопасностью и поддержкой ALT Linux, "Группа Астра", 22:07, 17.03.2026, Россия132
«Группа Астра» представила новую версию системы управления конфигурациями Astra Configuration Manager (ACM) 1.6. Релиз сфокусирован на повышении безопасности развертывания в защищенных инфраструктурах и продолжении стратегии мультивендорности — теперь решение поддерживает работу с операционной системой ALT Linux.


UDV Group: троянские программы — скрытая угроза, которая проникает незаметно, UDV Group, 22:06, 17.03.2026, Россия148
Троянские программы уже не те «старые знакомые» из старых плейбуков по кибербезопасности.


Группа «Борлас» обеспечит промышленным предприятиям переход с Teamcenter/NX на T-FLEX PLM с помощью инструментов искусственного интеллекта, Группа "Борлас", 22:06, 17.03.2026, Россия134
Группа «Борлас» (ГК Softline) объявляет о разработке модуля TC2TFD для миграции инженерных данных из Teamcenter® и NX® в программный комплекс T-FLEX PLM на основе инструментов ИИ.


Обновление Речевой аналитики BSS: каскадное промптирование, умный контекст и другие возможности, как драйверы качества обслуживания, BSS, 22:06, 17.03.2026, Россия117
Динамичное развитие речевой аналитики BSS с опорой на генеративный ИИ делают ее не только инструментом глубокого анализа, но и активным участником роста эффективности клиентского обслуживания.


Автоматизация взаимодействия с ГИИС ДМДК в ювелирной компании «Дэалексо» на базе «1С», ООО "АКСИОМА-СОФТ", 22:02, 17.03.2026, Россия46
В ювелирную компанию «Дэалексо» внедрили модуль «Аксиома: Интеграция с ГИИС ДМДК» на базе «1С». Полностью автоматизировали обмен данными с государственной системой, снизили ручной ввод, уменьшили ошибки и ускорили учёт ювелирных изделий. Работа стала существенно эффективнее.


«Кит-системс» – Золотой партнер ELTEX, Кит-системс, 21:59, 17.03.2026, Россия113
Системный интегратор «Кит-системс» подтвердил Золотой статус партнерской программы компании ELTEX на 2026 год.


Сразу два продукта компании «Деснол» получили статус «1С-Совместно Лучший продукт КОРП 2025», Деснол, 21:59, 17.03.2026, Россия43
Программные продукты Деснола вошли в топ-10 лучших решений 1С в версии КОРП


ГК «Оптимакрос» представила предварительные финансовые результаты за 2025 год, Оптимакрос, 21:59, 17.03.2026, Россия44
Российский разработчик CPM/IBP-платформы Optimacros подвел итоги деятельности за 2025 год и сообщает неаудированные финансовые результаты. Общая выручка ГК достигла 1,85 млрд рублей (без учета ВГО и НДС), увеличившись на 16% по сравнению с 2024 годом.


Навикон: в 2026 году более 80% ключевых российских BI-решений будут применять элементы ИИ, Navicon, 21:53, 16.03.2026, Россия157
Эксперты системного интегратора и разработчика Навикон обозначили основные тренды, которые будут формировать российский рынок бизнес-аналитики в 2026 году.


  © 2003-2026 inthepress.ru