 |
Синтезированный голос, аналогичный голосу диктора за 1 час обучения
Технология TTS (Text To Speech) позволяет воссоздать (синтезировать) голос конкретного человека для озвучивания виртуального помощника. Например, голос диктора или известной личности, если они являются частью имиджа компании. Обычно для создания уникального голоса используется гибридный подход TTS, где реплики живого человека сочетаются с синтезированной речью. Диктор озвучивает статические реплики, тем самым сохраняя естественность и богатство интонаций. Синтез используется для озвучивания переменных: дат, фамилий, тарифов, адресов и т.д. Такой подход позволяет голосовому помощнику корректно передавать эмоции и интонации в разговоре с клиентом. Ранее для создания уникального голоса требовалось от 15 до 20 часов аудиоматериала. Для справки: за один студийный день удается записать от 1 до 2 часов материала. Обычно сроки разработки увеличиваются, поскольку необходимо состыковать расписание студии, диктора и сроки проекта. У заказчиков возникает зависимость от расписания диктора: необходимо найти 10-15 свободных дней у диктора для записи материалов. Также стоит учесть расходы на оплату работы диктора и студии. Стоимость записи известных голосов за 1-2 часа чистого аудиоматериала может колебаться от сотни тысяч до нескольких миллионов рублей. Экономия времени заказчиков и оптимизация их расходов стали главными задачами команды BSS при разработке новой версии. Так было подготовлено большое обновление со сменой базовой технологии обучения. В новой версии TTS для создания уникального голоса необходимо 1-2 часа аудиоматериалов. Это всего лишь 1 рабочий день студии. Разработчики BSS ускорили процесс создания уникального голоса, сохранили качество записи, а также сделали возможной оптимизацию расходов заказчика. «Заказчикам нравится естественность речи при сочетании записанных диктором статических фраз с синтезированными динамическими фрагментами, которые звучат тем же голосом. Все большее число компаний, при внедрении голосовых помощников выбирают такой подход. Сейчас мы ведем несколько проектов с использованием гибридного TTS с обучением на одном часе аудио и планируем, что это станет массовым. В свою очередь работаем над повышением качества записи и эмоциональностью синтезированной речи», – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Контактное лицо: Вадим Прищепа
Компания: BSS
Добавлен: 22:20, 21.02.2024
Количество просмотров: 475
Страна: Россия
| Aladdin LiveOffice совместим с платформой Termidesk VDI 6.1.1, "Группа Астра", 23:13, 30.05.2026, Россия163 |
| Компании "Аладдин" и "Увеон – облачные технологии" (входит в "Группу Астра") объявляют о совместимости специализированного средства для безопасной дистанционной работы Aladdin LiveOffice с платформой для управления инфраструктурой виртуальных рабочих мест Termidesk VDI 6.1.1. |
| Первый БИТ стал генеральным партнером компании «ЭлНетМед», ЭлНетМед, 23:11, 30.05.2026, Россия166 |
| Российский интегратор бизнес-решений для здравоохранения «Первый БИТ» стал генеральным партнером компании «ЭлНетМед», разработчика интеграционной платформы N3.Health и крупнейшего оператора по передаче данных в ЕГИСЗ от частной медицины. |
| СИГМА — лауреат рейтинга Global CIO «Топ-100 ИТ-лидеров», ООО «СИГМА», 23:10, 30.05.2026, Россия62 |
| Константин Сипачев, директор департамента решений АСТУ СИГМЫ, вошел в число профессионалов, чей стратегический вклад в развитие российской ИТ-отрасли помогает выявлять лучшие практики, обмениваться знаниями и создавать отраслевые стандарты, что в условиях импортозамещения особенно важно. |
| «Группа Астра» проверила на ЦИПР уровень доверия облакам, "Группа Астра", 23:10, 30.05.2026, Россия183 |
| Недоверия к облакам уже нет, бизнес и провайдеры формируют новые правила игры. А «Группа Астра» представив собственное облако на российском процессоре Baikal-S, в котором безопасность заложена на уровне железа, активно строит новую реальность на этом рынке. |
|
 |