 |
Компания BSS в 10 раз сократила требования к объему аудиоматериалов для создания нового голоса бота
Голосовой робот BSS успешно консультирует клиентов максимально естественным голосом с человеческими интонациями. Новый мужской голос создан на основе голоса профессионального диктора, озвучившего необходимые для ведения диалогов с клиентами фразы. Озвучивание переменных данных (ФИО, улица, дата, номер и т.д.) производится на основе синтеза голоса этого диктора. Такой гибридный подход позволяет существенно сократить время на обучение модели, при этом обеспечить естественность, плавность и незаметность всех переходов и вставок. В процессе создания нового голоса команда BSS отобрала целевую лексику, которую использует робот при общении с абонентами в реальных проектах. Это помогло отобрать необходимые фразы и, тем самым, сократить количество используемых для обучения модели аудиоматериалов. Более того, команда подобрала специальный фонетический корпус, в котором обеспечено максимальное разнообразие трезвучий (включая редкие), что обеспечивает естественное и приятное звучание голоса. Собранные фразы были озвучены диктором. Для обучения модели, отвечающей за синтез голоса, понадобились 2 часа аудиозаписей вместо 15-20 часов, как было ранее. Синтезированный голос получился естественным, поскольку модель улавливала и учитывала интонации диктора. Такой способ обучения модели позволяет минимизировать разницу между ранее записанным голосом и синтезированным. «Мы смогли сократить длительность требуемых материалов с 15-20 часов до 2 часов, что позволяет нам выполнять проекты в более короткие сроки. Модель синтеза речи реализовали на новой архитектуре Conformer — это более современная архитектура нейронной сети, которая лучше справляется с синтезом длинных фраз. Если раньше мы сталкивались с «зажевыванием» в конце предложений, то теперь эта проблема минимизирована и длинные фразы звучат корректно. Естественность и качество нового голоса, скорость его создания – важные преимущества для любого проекта по внедрению и развитию виртуального ассистента», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа
Компания: BSS
Добавлен: 01:09, 15.06.2024
Количество просмотров: 224
Страна: Россия
LUIS+: биометрические технологии в России, LUIS+, 21:07, 17.08.2025, Россия110 |
Кирилл Гринберг, LUIS+, прокомментировал Коммерсанту текущий уровень развития биометрических технологий в России и их интеграцию в государственные и коммерческие сервисы. |
STEP LOGIC построил коммуникационный хаб для Positive Technologies, STEP LOGIC, 20:59, 17.08.2025, Россия128 |  |
STEP LOGIC разработал и внедрил в офисе Positive Technologies многофункциональное пространство для конференций и корпоративных мероприятий. Новый проект отражает тренд на трансформацию переговорных комнат в коммуникационные хабы. Мультимедийный комплекс поддерживает технологии беспроводного вывода презентаций, автонаведения камер и многопоточную трансляцию контента в сеть. |
«АльтерОфис 2025» успешно протестирован на Astra Linux, ALMI Partner, 23:10, 14.08.2025, Россия284 |  |
Тестирование охватило все критические аспекты взаимодействия программного обеспечения, включая установку, повседневную эксплуатацию, деинсталляцию и соответствие требованиям информационной безопасности. |
ЕДИНЫЙ ЦУПИС и новгородский филиал Академии «Динамо» развивают сотрудничество, ЕДИНЫЙ ЦУПИС (НКО "Мобильная карта"), 23:04, 14.08.2025, Россия285 |
ЕДИНЫЙ ЦУПИС, платежный сервис для любителей спорта, и новгородский филиал футбольной Академии «Динамо» имени Л.И. Яшина договорились о развитии сотрудничества. При поддержке ЕДИНОГО ЦУПИС в регионе продолжат развивать спортивную инфраструктуру, а воспитанники академии примут участие в престижных футбольных турнирах. |
|
 |