Stability Ai Выпустила Новую Линейку Аудио‑Моделей Stability Audio 3.0: Что Изменилось И Почему Это Важно

Ключевые выводы

  • Stability AI объявила о выходе Stability Audio 3.0 — четырёх новых моделей, способных генерировать композиции до 6 минут 20 секунд.
  • Модели small SFX, small и medium доступны с открытыми весами, а large – только через платный API и с enterprise‑лицензией.
  • Новые модели построены на полностью лицензированных музыкальных данных и поддерживают сотрудничество с Warner Music и Universal Music.
  • Конкуренты (Google Lyria 3 Pro, ElevenLabs) тоже развивают генерацию музыки, но правовые споры вокруг использования контента могут стать узким местом.
  • Stability AI усиливает команду: к компании пришёл Этан Каплан, бывший chief digital officer Universal Audio и Fender, отвечающий за профессиональные музыкальные решения.
Генерация музыки ИИ стремительно развивается, и Stability Audio 3.0 — один из самых масштабных шагов за последний год. Давайте разберём, что именно изменилось, какие возможности открываются пользователям и какие ограничения остаются.

Что представляет собой семейство Stability Audio 3.0?

Stability AI объявила о запуске четырёх новых аудио‑моделей под брендом Stability Audio 3.0. Это:

  • small SFX — 459 млн параметров, оптимизирована для генерации звуковых эффектов и коротких музыкальных фрагментов (до 2 минут).
  • small — тоже 459 млн параметров, ориентирована на on‑device генерацию мелодий и саундтреков той же длительности.
  • medium — 1,4 млрд параметров, способна создавать полные композиции до 6 мин 20 сек.
  • large — 2,7 млрд параметров, аналогичные возможности, но доступна только через платный API и enterprise‑лицензию.

Главное отличие от предыдущей версии (Stability Audio 2.0, 2024 г.) — удвоенная длина генерируемых треков. Теперь модели medium и large способны поддерживать музыкальную структуру и мелодический тон почти на протяжении семи минут.

Три из четырёх моделей (small SFX, small, medium) выпускаются с открытыми весами – их можно скачать, доработать и внедрять в свои проекты без ограничений.

Технические особенности и практические сценарии

С точки зрения параметров, small SFX и small находятся в одном «классе» — 459 млн параметров, что делает их лёгкими для работы на мобильных устройствах и в браузерах. Они подходят для создания коротких звуковых логотипов, интерактивных эффектов в играх и быстрых демо‑мелодий.

Medium — уже более серьёзный игрок: 1,4 млрд параметров позволяют модели «понимать» более сложные гармонические прогрессии и сохранять тембральную консистентность на протяжении всей композиции. Это открывает двери для независимых продюсеров, желающих экспериментировать с аранжировкой подкастов или рекламных роликов.

Large‑модель, несмотря на закрытый доступ, предлагает наибольшую детализацию звучания, что важно для профессиональных студий, которым нужен «звуковой партнёр» уровня коммерческих синтезаторов.

Во всех моделях используется полностью лицензированный музыкальный датасет, собранный в рамках партнёрства со Warner Music Group и Universal Music Group. Это помогает избежать правовых проблем, которые сейчас обсуждают компании Suno и Udio.

Условия доступа: открытые веса vs платные лицензии

Открытый доступ к small SFX, small и medium — большой плюс для исследователей и стартапов. Можно быстро развернуть модель локально, адаптировать под свой набор звуков и интегрировать в продукты без абонентской платы.

Large‑модель, напротив, доступна только через API Stability AI и требует подписки. Кроме того, компании с годовым оборотом более 1 млн USD должны оформить enterprise‑лицензию, что подразумевает дополнительные гарантии по защите данных и поддержке.

Эти различия создают два сегмента рынка: DIY‑сообщество и крупные коммерческие пользователи, которым нужны гарантии качества и юридической чистоты.

Конкурентный ландшафт: кто ещё выпускает музыкальные ИИ‑модели?

На фоне выхода Stability Audio 3.0 другие крупные игроки тоже активизируются:

  • Google представил Lyria 3 Pro — модель, ориентированную на создание многослойных аранжировок для рекламных агентств.
  • ElevenLabs выпустила собственный генератор музыки, сфокусированный на синтезе вокальных партий.

Однако правовые баталии вокруг использования аудио‑данных (дела Suno и Udio) показывают, что доступ к лицензированным материалам станет ключевым конкурентным преимуществом. Stability AI уже заявила, что их новые модели построены исключительно на лицензированных треках, что может стать решающим фактором для крупных лейблов.

Команда и стратегические ходы компании

Stability AI усиливает свою музыкальную экспертизу, привлекая в команду Этана Каплана — бывшего chief digital officer в Universal Audio и Fender. Он возглавит развитие профессионального музыкального продукта, который, по словам компании, будет ориентирован на продюсеров, саунд-дизайнеров и крупные медиа‑домы.

Не случайно: в индустрии сейчас наблюдается «битва за таланты». Suno нанял бывшего CEO Merlin Джереми Сироту, а ElevenLabs — Дерека Курнойера из Kobalt. Наличие опытных музыкальных менеджеров в команде помогает ИИ‑стартапам быстрее находить коммерческие ниши и заключать сделки с лейблами.

Как использовать Stability Audio 3.0 уже сегодня?

Если вы разработчик или независимый музыкант, первым шагом будет скачивание открытых весов модели medium с официального репозитория Stability AI. После установки вы сможете:

  1. Генерировать треки до 6 минут, задавая стиль, темп и инструменты через простой JSON‑запрос.
  2. Экспортировать полученный аудио‑файл в формате WAV/MP3 и дальше обрабатывать в DAW (Ableton, Logic).
  3. Тестировать различные подсказки (prompts) и сохранять лучшие варианты в библиотеке.

Для компаний, которым нужен масштаб и поддержка уровня enterprise, стоит связаться с отделом продаж Stability AI, оформить API‑доступ и обсудить условия лицензии, учитывая объём предполагаемого использования.

Справка

Stability AI — стартап, основанный в 2020 году, известный прежде всего по модели Stable Diffusion, открывающей возможности генерации изображений. В 2023‑2024 годах компания расширила портфель до аудио‑моделей и видеогенераторов.

Stable Diffusion — одна из первых открытых моделей диффузионного генератора изображений, позволившая сообществу создавать качественные картинки без облачных сервисов.

Warner Music Group — один из «большой трёх» мировых музыкальных лейблов; в 2023 году подписал соглашение со Stability AI о совместной разработке AI‑инструментов.

Universal Music Group — крупнейший в мире музыкальный холдинг, также сотрудничает со Stability AI, предоставляя доступ к своим каталогам для обучения моделей.

Этан Каплан — профессионал с опытом работы в Universal Audio и Fender, в 2025 году перешёл в Stability AI, где отвечает за создание профессиональных музыкальных решений на базе ИИ.

Stability Audio 3.0 уже меняет правила игры: от открытых моделей для хобби‑проекта до мощного облачного сервиса для корпораций. Если вы ищете гибкое решение для генерации музыки, сейчас самое время попробовать новую линейку от Stability AI.

Интересно почитать :

Тим Кук уходит с поста CEO Apple: чему готовится новый глава Джон Тёрнус и что
будет дальше?
Тим Кук уходит с поста CEO Apple: чему готовится новый глава Джон Тёрнус и что будет дальше?

Ключевые выводы Тим Кук оставит пост CEO Apple в сентябре 2026 года, перейдя на роль исполнительного председателя. Наследником станет Джон Тёрнус – ранее глава аппаратного отдела, известный как «продуктовый человек». …

OpenAI против Anthropic: кто использует «страшный» маркетинг в AI‑безопасности?
OpenAI против Anthropic: кто использует «страшный» маркетинг в AI‑безопасности?

Ключевые выводы Сэм Альтман критиковал «страшный» PR‑ход Anthropic по модели Mythos, назвав его попыткой удержать ИИ в руках элиты. Anthropic заявила, что ограничивает доступ к Mythos из страха перед злоупотреблениями …

Moment Energy привела $40 млн инвестиций для масштабирования безопасных
аккумуляторов из электромобилей
Moment Energy привела $40 млн инвестиций для масштабирования безопасных аккумуляторов из электромобилей

Ключевые выводы Moment Energy привлекла $40 млн в раунде Series B, общий объём финансирования превысил $100 млн. Стартап перепрограммирует батареи из электромобилей, получает официальную UL‑сертификацию и предлагает модульные решения для …

IBM согласилась на $17 млн компенсацию: что стоит за первым делом
Госдепартамента в рамках инициативы «Civil Rights Fraud»
IBM согласилась на $17 млн компенсацию: что стоит за первым делом Госдепартамента в рамках инициативы «Civil Rights Fraud»

Ключевые выводы IBM согласилась выплатить $17 млн США, не признавая вины, за alleged нарушения DEI‑политики в рамках федеральных контрактов. Сделка стала первой реализацией инициативы «Civil Rights Fraud», стартовавшей после приказа …

Glydways привлек $170 млн и готовится к очередному раунду в $250 млн: автономные
поды меняют облик городов
Glydways привлек $170 млн и готовится к очередному раунду в $250 млн: автономные поды меняют облик городов

Ключевые выводы Glydways привлек $170 млн в раунде Series C, соинвесторы – Suzuki Motor, ACS Group и Khosla Ventures. Компания планирует второй раунд в $250 млн, что может поднять её …

End‑to‑end шифрование в RCS: iPhone и Android наконец могут писать друг другу в
защищённом режиме
End‑to‑end шифрование в RCS: iPhone и Android наконец могут писать друг другу в защищённом режиме

Ключевые выводы Apple и Google начали бета‑тестировать сквозное шифрование в RCS‑сообщениях между iPhone и Android. Шифрование защищает переписку от хакеров, правительств и даже компаний‑операторов. Новые возможности RCS (индикатор набора, реакция …

ФильтрИзбранноеМеню43750 ₽
Top