Ультралёгкий генератор речи, который можно запустить буквально на любом железе.

MOSS-TTS-Nano работает даже без видеокарты — нейронке хватает обычного процессора на 4 ядра.

При этом модель:
очень быстро озвучивает текст;
поддерживает 20 языков, включая русский;
выдаёт качественный звук в 48 кГц;
умеет клонировать голоса;
спокойно озвучивает длинные тексты.

Подходит для AI-агентов, локального TTS, озвучки видео и голосовых ассистентов!

Установка:
git clone https://github.com/OpenMOSS/MOSS-TTS-Nano.git
cd MOSS-TTS-Nano

pip install -r requirements.txt
pip install -e .


Клонирование голоса:
python infer.py \
--prompt-audio-path audio.wav \
--text "yout_text"


Сохраняем и пробуем ТУТ

Спальня админа |
Зеркало Max

#python #soft
👍 41
🔥 18
8
655 9.6K

Обсуждение 0

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram