Пресс-релизы // » Добавить пресс-релиз

Новая технология «Наносемантики» повышает точность распознавания голосовых запросов в 12 раз

Новая технология для определения ключевой фразы Keyword Spotter (KWS) от «Наносемантики» способна в разы улучшить работу голосового помощника. Разработка основана на нейросетевой модели KWS с архитектурой CNN-Transformer, обученной на собранных компанией датасетах общей продолжительностью более 100 часов аудио. За счет такого подхода, технология демонстрирует высокие показатели метрик точности и полноты активаций ассистента на аудио, полученных, в том числе, в шумных условиях.

Разработанная «Наносемантикой» технология KWS в связке с детектором голосовой активности - Voice Activity Detection (VAD) может повысить точность распознавания голосовых запросов и улучшить качество работы цифровых помощников - «умных» колонок и цифровых ассистентов на онлайн-платформах и в приложениях. Результаты тестирования, проведенного для коммерческого заказчика, показали, что точность распознавания ключевой фразы цифровым помощником выросла в 12 раз по сравнению с предыдущей моделью благодаря внедрению связки технологий VAD и KWS, разработанных «Наносемантикой».

Качественно лучшего результата удалось добиться за счет выбранной архитектуры модели CNN-Transformer, логики обработки потокового аудио, а также объемного и разнообразного датасета. Технология VAD может «отличить» речь человека от других шумов, после чего направить нужные отрывки со смещениями на дальнейшее распознавание моделью определения ключевой фразы - KWS.

Модель обучается определять выбранную ключевую фразу, на которую активируется цифровой помощник. Для обучения используются созвучные фразы-мимики и большое количество различных искажений (аугментаций) - они позволяют достичь устойчивости модели к помехам и похожим на ключевую фразу словам.

При разработке под ключ для повышения показателей метрик качества KWS команда сборщиков и разметчиков данных «Наносемантики» собрала базу данных аудио с записанной ключевой фразой женскими и мужскими голосами в разных вариантах: нейтрально, громко, шепотом, медленно, отвернувшись от устройства и так далее. Кроме того, делается разбивка по качеству звучания: часть аудиозаписей записывают в идеальном «студийном» качестве, другую часть – с посторонними шумами в различных помещениях и уличных условиях. Общая продолжительность данных для датасета превысила 100 часов.

VAD и KWS почти не разряжают батарею, а также могут быть запущены на большинстве смартфонов, в том числе оффлайн, за счет своего небольшого объема - вес VAD на базе модели CNN BilSTM составляет 0,5 МБ, а KWS - 4 МБ.

«За счет качественной работы с данными и использования оптимальных нейросетевых архитектур связка модулей VAD и KWS ‘’Наносемантики’’ способна существенно улучшить качество работы ассистента в распознавании ключевой фразы, что важно для активации голосовых помощников. Это популярное решение интегрируют в приложения и платформы во всех сегментах – от ритейла до банков, а также используют самостоятельно в ‘’умных’’ колонках. От точности работы технологии KWS зависит, насколько хорошо вас будет ‘’понимать’’ голосовой помощник, включаясь в тот момент, когда вы его действительно об этом просили», - комментирует Павел Сухачев, директор по Data Science компании «Наносемантика».

Справка:
«Наносемантика» — ведущий российский производитель решений и продуктов на основе нейросетей. За 18 лет на рынке ИТ-компания разработала более 12 собственных интеллектуальных продуктов и платформ, реализовала свыше 130 проектов для бизнеса. Команда из научных сотрудников и разработчиков обладает обширной базой знаний и практик в области машинного обучения.

Контактное лицо: Татьяна Алексеева
Компания: Наносемантика
Добавлен: 22:19, 14.11.2023 Количество просмотров: 254
Страна: Россия


Увеличение количества отобранных резюме на 31% и скорости найма на 15%: BIA Technologies внедрила ИИ-технологии в HR-процессы, BIA Technologies, 15:05, 26.11.2025, Россия100
Эксперты ИТ-компании интегрировали в работу отдела по работе с персоналом ML-скоринг, который ранжирует список наиболее подходящих кандидатов. Система одновременно анализирует анкеты из пяти различных источников и повышает конверсию в рекрутинге.


Сразу четыре проекта победили в конкурсе «1С:Проект года» с продуктами от Деснола и фирмы «1С», Деснол, 15:05, 26.11.2025, Россия96
Внедрения продуктов Деснола победили в 4-х номинациях на конкурсе "1С:Проект года".


Корпоративный AI без утечек данных: TEAMLY представили масштабное обновление платформы для управления знаниями и обучением, TEAMLY, 15:03, 26.11.2025, Россия92
Москва, 25 ноября 2025 года. Российская платформа TEAMLY представила очередное крупное обновление. Ключевые функции – поиск информации, обучение сотрудников и управление корпоративными знаниями – получили AI-усиление.


UDV Group: Разбираем самые частые и дорогостоящие ошибки SMB в безопасности, UDV Group, 20:59, 25.11.2025, Россия194
В статье разберем самые частые и дорогостоящие ошибки SMB в безопасности и дадим готовый план действий, как проверить свои слабые места и усилить защиту за короткий срок.


ЛУИС+ проведет вебинар «Телекоммуникационные шкафы SKAT», ЛУИС+, 20:59, 25.11.2025, Россия182
Мероприятие ориентировано на специалистов, работающих с инженерной инфраструктурой и системами безопасности на объектах различного назначения. Ведущей вебинара выступит Вероника Малёваная, ведущий пресейл-инженер компании ЛУИС+.


Продукт Dat.ax признан эталонным ETL-инструментом для работы с AI, Axenix, 20:59, 25.11.2025, Россия188
Российский программный продукт Dat.ax занял лидирующие позиции в независимом исследовании «ETL Круг Громова 2025», посвященном состоянию рынка ETL-систем в России и трендам их развития.


РЭУ им. Г.В. Плеханова внедрил GreenData Messenger для внутренней коммуникации, GreenData, 20:58, 25.11.2025, Россия184
Кафедра прикладной информатики и информационной безопасности РЭУ им. Г.В.Плеханова внедрила корпоративный мессенджер GreenData Messenger.


«Хи-Квадрат» создала конвертер для быстрой миграции с Oracle APEX, Хи-Квадрат, 20:57, 25.11.2025, Россия207
Компания «Хи-Квадрат», создатель платформы для быстрой разработки приложений и сложных бизнес-систем с минимальными затратами на программирование XSQUARE, представила первый на российском рынке конвертер приложений с Oracle APEX и Oracle Forms.


Minervasoft и Chatme.ai объявили о сотрудничестве в области корпоративных AI-агентов, Minervasoft, 20:56, 25.11.2025, Россия157
Компания Minervasoft, которая обеспечивает комплексное управление знаниями сотрудников и ИИ-помощников, и эксперт в области продвинутых AI-агентов на базе LLM Chatme.ai, подтвердили возможность интеграции умного чат-бота с корпоративной базой знаний Minerva Knowledge.


В России запущен первый полноценный ИИ-поиск «Жижи» с цитированием источников, ЖИЖИ (ООО "Монстр17"), 20:53, 25.11.2025, Россия164
В России представлен первый полноценный ИИ-поиск «Жижи», использующий генеративные модели и адаптированный под российский интернет-сегмент. Новый продукт стал отечественной альтернативой зарубежным сервисам Perplexity.ai и ChatGPT Search и позволяет получать ответы с цитированием источников.


БФ «Свет в руках» запустил проект «Жизни быть!» для поддержки женщин, переживающих репродуктивные трудности и сложные жизненные ситуации, Благотворительный фонд «Свет в руках», 18:22, 25.11.2025, Россия159
Благотворительный фонд системных инициатив в сфере репродуктивного и перинатального здоровья «Свет в руках» объявляет о запуске нового проекта «Жизни быть!», направленного на оказание бесплатной психологической помощи женщинам и семьям, переживающим трудности в сфере репродуктивного здоровья и оказавшимся в сложных жизненных обстоятельствах.


ГК X-Com оснастила мультимедийными системами актовые залы МАИ, ГК X-Com, 18:18, 25.11.2025, Россия164
Группа компаний X-Com разработала и внедрила современные мультимедийные системы в малом и большом актовых залах в новом корпусе МАИ на Оршанской.


«1С-Рарус» перевел поставщика техники MAN на «Альфа-Авто», 1С-Рарус, 18:18, 25.11.2025, Россия89
«1С-Рарус» внедрил в компании «МТБР» отраслевую систему собственной разработки на платформе 1С. Благодаря «Альфа-Авто:Автосалон+Автосервис+Автозапчасти» ускорена обработка заказов и налажено более эффективное взаимодействие с дилерами и контрагентами, что повысило качество услуг компании.


«Кит-системс» оснастил учебные аудитории всех кампусов РТУ МИРЭА в Москве, ООО "Кит-системс", 18:18, 25.11.2025, Россия108
Системный интегратор «Кит-системс» масштабировал парк клиентского оборудования «МИРЭА. В аудиториях шести московских учебных корпусов ВУЗа оборудовано 1 970 автоматизированных рабочих мест (АРМ).


Обновлен сервис «Гарант ДокМэйл», Компания "Гарант", 18:17, 25.11.2025, Россия91
Работа с электронными документами стала еще удобнее и эффективнее.


  © 2003-2025 inthepress.ru