- Text To Speech
- MARS5 TTS
GitHub - Camb-ai/MARS5-TTS: Модель речи MARS5 (TTS) от CAMB.AI
Введение
MARS5: Новая модель речи для безумной просодии. MARS5 - модель английской речи (TTS) от CAMB.AI. Создайте речь с помощью MARS5 за 5 секунд. Проверьте демонстрацию.
MARS5 TTS's Обзор
MARS5 is an innovative English speech model (TTS) created by CAMB.AI, following a two-stage AR-NAR pipeline featuring a unique NAR element. With just 5 seconds of audio and some text, MARS5 can generate high-quality speech suitable for various contexts like sports commentary and anime. Users can influence the prosody of the output by utilizing punctuation and capitalization. It allows for speaker identity specification through an audio reference file, supports shallow and deep cloning, and can be conveniently loaded using `torch.hub`. MARS5 offers customizable inference settings and provides hardware requirements on its GitHub repository, inviting contributions to enhance the model.
MARS5 TTS's Характеристики
Двухступенчатая AR-NAR архитектура
Управляемая просодия с помощью пунктуации и заглавных букв
Указание идентичности говорящего
Мелкое и глубокое клонирование
Простая загрузка модели с помощью `torch.hub`
Инференс с использованием аудиофайла-ссылки и транскрипта
Открытый код с альтернативными лицензионными опциями
MARS5 TTS's ВОПРОСЫ И ОТВЕТЫ
MARS5 TTS's Ценообразование
MARS5 является открытым исходным кодом и доступен под лицензией GNU AGPL 3.0. Для альтернативных лицензионных опций, пожалуйста, свяжитесь с [email protected]
MARS5 TTS's Аналитика
Обзор сайта
Ключевые показатели эффективности для github.com
Показатель отказов
38.34%
Страницы / Посещение
6.50
Всего посещений
437,914,238
Время на объекте
7m 18s
Глобальный рейтинг
#78
Рейтинг страны
#111
Топ-регионы
Распределение трафика по странам
- 1.United States15.94%
- 2.China15.11%
- 3.India9.28%
- 4.Japan3.94%
Всего посетителей
Ежемесячная статистика посещений за последние 3 месяца
Источники трафика
Распределение источников трафика