☝🏻Stability AI представила Stable Audio 3.0 — новое поколение моделей для генерации музыки и звуковых эффектов по текстовому описанию 🎵
Семейство включает четыре варианта:
Small SFX и Small (по 459 млн параметров), Medium (1,4 млрд) и Large (2,7 млрд параметров).
Старшие модели — Medium и Large — способны создавать полноценные композиции длительностью
до 6 минут 20 секунд, что более чем вдвое превышает возможности предшественника Stable Audio 2.0, ограничивавшегося тремя минутами.
Компактные модели Small предназначены
для работы на пользовательских устройствах и генерируют
треки до 2 минут без подключения к облаку.👍🏻
Помимо генерации с нуля, модели поддерживают редактирование звука через инпейнтинг, включая продолжение и многосегментные правки.
Обучение проведено исключительно на лицензированных данных — 806 284 аудиозаписи от библиотеки AudioSparx и 472 618 записей из базы Freesound под лицензиями Creative Commons.
Весь музыкальный контент из Freesound прошёл фильтрацию на наличие защищённого авторским правом материала. 🔒
☝🏻Три модели из четырёх выложены с открытыми весами — скачать и модифицировать их
может любой.
Крупнейшая Large доступна только через API Stability AI, партнёра fal ai или по корпоративной лицензии.🤷🏼♀️
================
У этого канала есть
YouTube Shorts
Обсуждение 0
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram