Чёрный Треугольник (@black_triangle_tg): ☝🏻Stability AI представила — новое поколение моделей для генерации музыки и звуковых эффе…

☝🏻Stability AI представила Stable Audio 3.0 — новое поколение моделей для генерации музыки и звуковых эффектов по текстовому описанию 🎵

Семейство включает четыре варианта:
Small SFX и Small (по 459 млн параметров), Medium (1,4 млрд) и Large (2,7 млрд параметров).

Старшие модели — Medium и Large — способны создавать полноценные композиции длительностью до 6 минут 20 секунд, что более чем вдвое превышает возможности предшественника Stable Audio 2.0, ограничивавшегося тремя минутами.

Компактные модели Small предназначены для работы на пользовательских устройствах и генерируют треки до 2 минут без подключения к облаку.👍🏻

Помимо генерации с нуля, модели поддерживают редактирование звука через инпейнтинг, включая продолжение и многосегментные правки.

Обучение проведено исключительно на лицензированных данных — 806 284 аудиозаписи от библиотеки AudioSparx и 472 618 записей из базы Freesound под лицензиями Creative Commons.

Весь музыкальный контент из Freesound прошёл фильтрацию на наличие защищённого авторским правом материала. 🔒

☝🏻Три модели из четырёх выложены с открытыми весами — скачать и модифицировать их может любой.

Крупнейшая Large доступна только через API Stability AI, партнёра fal ai или по корпоративной лицензии.🤷🏼‍♀️
================
У этого канала есть YouTube Shorts

Обсуждение 0

Вход в экосистему

Ваши настройки cookie