Ультралёгкий генератор речи, который можно запустить буквально на любом железе.
MOSS-TTS-Nano работает даже без видеокарты — нейронке хватает обычного процессора на 4 ядра.
При этом модель:
очень быстро озвучивает текст;
поддерживает 20 языков, включая русский;
выдаёт качественный звук в 48 кГц;
умеет клонировать голоса;
спокойно озвучивает длинные тексты.
Подходит для AI-агентов, локального TTS, озвучки видео и голосовых ассистентов!
Установка:
git clone https://github.com/OpenMOSS/MOSS-TTS-Nano.git
cd MOSS-TTS-Nano
pip install -r requirements.txt
pip install -e .
Клонирование голоса:
python infer.py \
--prompt-audio-path audio.wav \
--text "yout_text"
Сохраняем и пробуем ТУТ
Спальня админа |
Зеркало Max
#python #soft
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram