Вышла версия 1.5. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.
Ну вы мазохисты, которые на юдио. Я ее прошу индастриал-металл сделать, она мне то русский рок, то Гребенщикова выдаст, то еще какую хрень.12 генераций и все мимо. Прошу небольшой инструментал перед вторым куплетом, не делает, а если и делает, то на 10 попытке. То полкуплета забудет спеть, то песню завершает на ровном месте. Не говоря уже что окает, ударения игнорирует, слетает кнопка extend без конца. Божественное юдио.
>>977801 Спасибо анон. Согласен с замечанием. Не получилось собрать ближе к идеалу, долгое время не выкладывал ни где, сюда забросил посмотреть на реакцию.
>>978013 Да, Udio, в Suno так не сделать. Поэтому предлагаю перекатываться в Udio. Конкретно по этой песне промт такой: female vocalist, pop, melodic, love, electronic, bittersweet, electropop, introspective, soft, indie pop, melancholic, lush, alt-pop, emotional, instrumental. Пробуй.
>>976288 Не очень люблю такое, но твой трекс слушать приятно
>>977527 а это не ты педофайл? В прошлых тредах забавные песни генерил анон в похожем музыкальном стиле. В любом случае классно, нравится твой вкус, но шизу надо лечить, ога. Как в уидо найти? Хочу в mp3 скачать, нраица Продолжай колдовать в downtempo
>>978418 фига крутышка, концептуальненько, прям старался, слышно. Красавчик, понравилось. Наряду с аноном выше украшаете тред своими работами, но в середине и концовке просел трек в части накала
>>978444 >нет, это же суно Суно хотя бы реально сочиняет(и иногда очень годно) а не лепит из разных треков новый. Практически каждый отдает вторичностью, а если нет - значит просто не слушал такую музыку.
>>978471 >наша великая нейронка творит композицию, которой раньше не было >их богомерзкое поделие копипастит трек из огрызков существующих треков ну понятно. Самому не смешно? Или ты ещё не на том интеллектуальном уровне, чтобы не вставать на чью-то сторону и обсирать противоположную, а просто пользоваться тем, что тебе нравится (если это не ублюдское суно, конечно)?
>>978475 Говорю как слышу, суно может выдавать такие вещи которых я никогда в жизни не слышал вообще, удио - всегда лишь вторичность, просто пересобранные заново уже написанные песни.
>>977058 Надо потестить на генерации хип хопа, сделать крутой флоу и рифмовку это жесть как сложно даже для человека. Можно проверять какие модели так могут, интересно как новыц Гемини может в лирику
Как так вышло что генерация музыки это единственная крупная сфера которую опенсорс обошел стороной? Просто пиздец как не терпится пилить лоры на аудиомодели, делать audio to audio со своим вокалом и настукиваниями и т.д.
>>978180 Продолжаю экспериментировать и в этот раз взял за основу текст Сектор Газа-Щи. Сделал два варианта песни. Первый сделал в жанре witch house, добавил немного darkа и heavy.
вспомнил песенку времён вьетнамской войны в ней поётся о том, что парень получает письмо от девушки и собирается лететь к ней немного осовременил текст и добавил женский вокал
Блять, какое же суно v4 говнище ебаное по сравнение в удио. Чем они вообще всю разработку занимались? Песни на русском без галюцинаций это наверное единственное что держит многих на суно
>>982997 Суно специально заруинили все настройки чтоб выдавало только говно и обмазывало калом даже нормальные роллы, это факт железобетонный. Даже на старте второй версии все было на порядок лучше в плане написания качественной мелодии. Не особенно верится что они не специально слили в толчок то что успешно работало. Хотя я не разбираюсь в этих ваших нейросетях. Опять же даже тот факт что этих настроек видимых никаких нет, уже говорит о многом, крутят там себе че хотят.
>>982997 Ой, не надо ерунду говорить, мне понравилось, я шесть песен пока сгенерировал, вокал живее, звук лучше, музыка разнообразней. Прогресс налицо. А вот с Юдио я съебал и больше туда ни ногой, на ней только одна нервотрепка, она вообще не делает то что ты просишь от нее. Если ты мазохист, нравится тебе коноёбиться с одной песней месяц, пожалуйста.
>>983078 В удио главный геморой это подобрать правильные настройки под жанр, тогда он норм генерить будет. А пока подберешь настройки уже половины кредитов нету
>>983078 Удио генерит что-то хорошее, суно это просто шум ебаный на фоне генераций удио. Может ты там конечно какие-то дженерик жанры генеришь, что оно без проблем делает, но дальше какого-нибудь трэпа, кантри и попсы получается цифровая каша на уровне третьей версии
10 песен в месяц, молодцы. Притом что сразу 2 песни на один текст, одну в мусорку, правильно? Сделали бы тогда по одной песне. А экстенды-огрызки тоже будут считаться за полноценные песни?
Как обходить блокировки аккаунтов от Макрософт? Раньше изи можно было хоть 500 аккаунтов сделать, чтобы Suno пользоваться, сейчас банит сразу же после регистрации. Чистить кэш, ВПН, смена браузера, смена религии - все пробовал.
>>982504 ты такой пердёж в суно не сделаешь (мне такое не нравится, хотя трекс так-то качественный)
ты можешь что-то смутно похожее нароллить в суно, но это будет куда проще/линейнее/однообразнее, к тому же звук будет выкакан, как всегда бывает у суно. Хотя отдельные жанры суно неплохо делает, надо признать - классические арии и эпические хоровые композиции, например. "Хуем впидорасившись по яйца" в исполнении хора в сердечке - до слёз пробирает каждый раз. Олсо в моей коллекции так-то больше суно-треков, ибо сочинять в удио - тот ещё пердолинг
>>982459 ебать ты гений. Я требую ссылку на удио - хочу скачать мп3. Такой-то айспик вышел, который не скурвился
>>981963 ахахааххах. Ну вы только посмотрите на эту чмоню!
>>984122 На мои шедевры весь тред дрочит, окстись. Конечно, это не столько из-за удио, сколько из-за моего необузданного гения, но всё же я как истинный эстет выбираю удио
>>984127 Суно 4 практически приблизилась по качеству звука к юдио. Но генерирует сразу целую песню, а не 30-секундный огрызок. А юдио за полгода нихуя не продвинулась, а стала только хуже и глючней.
>>984065 >ты такой пердёж в суно не сделаешь (мне такое не нравится, хотя трекс так-то качественный) >ты можешь что-то смутно похожее нароллить в суно, но это будет куда проще/линейнее/однообразнее, к тому же звук будет выкакан, как всегда бывает у суно. >ибо сочинять в удио - тот ещё пердолинг Дружище, я в общем тоже самое сказал. Слово в слово. И качество не делает ценность чего-либо.
>>984239 В башке ты, возможно, и поэму написал, но текстом высрался довольно скупо и те тезисы, которые привёл я, преимущественно в своём посте не обозначил. Очередная победа удиолорда над сунодебилом
>>977144 Попробовал v4 на тексте самого первого шедевра. Что-то суно об-удилось. Высирает дженерик тынц тынц вместо написанных жанров. Только с последней десятой попытки норм вышло. Да, голос хорош, но души(тм) не хватает. Раньше было лутше.
>>985021 Отказался от технических пометок вроде [verse1] [chorus], с ними мне в 9 из 10 песен повторяло 2-й куплет после третьего постоянно. Стало лучше без них, но все равно повторы бывают.
>>984390 Анончик, можешь скинуть ссылку на свою павер-поп версию с альфачом вокалистом? Хочу закаверить пробнуть этот шедевр. хочу её трахнуть да так чтоб аж искры из глаз! от ебли буду кончать как водопад!
>>985343 а мне, наоборот, больше первая понравилась. Пусть я и хейтер суно, но это уже можно слушать (хотя всё равно суно-жужжанье слышно). Достойно, словом
чот полез в удиосохранёнки и вспомнил первые дни выхода удио, когда оно генерило голоса известных певцов. Эх, золотая пора...
>>985841 прости если трахнулнаступил на уши, бро. Я не хотел
Тому треку, чтобы стать нереально крутым, потребовался бы нереально крутой пост-продакшн, даже если мы имаджинируем в голове (приходится имаджинировать, потому что суно и близко не может высрать околостудийный звук) студийное качество. И это при том, что я большой любитель электроклаша и в целом согласен, что есть отдельные удачные звуковые решения в том треке - слушать сунопердёж невозможно
>>986097 >Требует студийного качество звука Ты опять начинаешь уточнять, то уже сказано? Его можно переписать в студии полностью, с "профессиональными инструментами", голосом и сведением. Там есть проблемы, но они легко закрываются и дополняются. Композиционно это хит, быстро запоминается, есть мотив навязчивости, не перегружен. Идея электронной славистики и органика современной интерпретации уровня Хадн Дадн и Oligarkh, а вообще субъективно получилось даже лучше. Да это ИИ сделал, а человек ему помог и сформулировал, да, мы повышение качества в голове сделали, но это реально крутой рандом.
>>986154 >Композиционно это хит Ебланище, хит это Adele - Hello, Taylor Swift - Blank Space, Katy Perry - Dark Horse, Sia - Chandilier, Linkin Park - Numb, дерьвана - смеллс тин лайк спирит, не перепутай в следующий раз со своим манямирком.
>>986154 >Идея электронной славистики и органика современной интерпретации уровня Хадн Дадн и Oligarkh Хадн Дадн не торт, конечно, но не настолько же...
>Композиционно это хит, быстро запоминается, есть мотив навязчивости, не перегружен. у суно тогда что ни трек - однообразная хуйнякомпозиционный хит. Впрочем, справедливости ради, такая хуйня действительно могла бы выстрелить, ибо это что-то уровня Бузовой/Нюши/прочей продюссерской параши
>>986391 >у тебя даже вкуса нет У меня есть слух, идиота ты кусок, и большую часть того что я слушал подбирал все мелодии, и уж точно отлично различаю где в музыке есть что-то оригинальное и красивое, а где кал-говно-моча для выблядков, которым важно лишь понтоваться своим неким "вкусом", маскирующим их полнейшую неспособность к адекватной оценке музкальной композиции.
>>986205 Обозначенные треки имеют довольно много общего с сунодриснёй, которую восхваляет анон выше - тоже довольно примитивные и линейные структурно.
Твои треки, помимо качества звука, выгодно отличает вокал (в отдельных треках) и пост-продакшн от сунодрисни. В общем-то, всё. Такой же трек от удио был бы хитом в твоей терминологии, ибо обозначенные характеристики подтянул бы (кроме разве что вокала - но у продюссерской дрисни он необязателен, быдло схавает образ).
>>986414 >У меня есть слух Слух оценивает качество конструкции музыки, а не ее качество красоты, "естественности".
>оригинальное и красивое Ты одну коммерцию привел, которая оригинальность берет из цикличности, академических основ и трендов. Тряску из-за Нирваны не надо начинать.
И я не понтовался вкусом, а у тебя видимо с этим проблемы.
>>986398 >Впрочем, справедливости ради, такая хуйня действительно могла бы выстрелить, ибо это что-то уровня Бузовой/Нюши/прочей продюссерской параши Признаю, зашел в своем комплименте за край. Но в общем смысл был том, что обычный человек может делать уровень и, мой субьектив в том, что я бы лучше это слушал, чем Нюш и Бузовых.
>>986441 >Такой же трек от удио был бы хитом Пиздец, какие же ебланы тут сидят, я съебываю. Вы просто конченные дегенераты. >Уйми тряску тряску теперь не унять
В ии треках главное чтобы было не скучно, унылую дрисню можно и так послушать везде, а смешных треков очень мало ибо в мейнтриме никогда не будет прикалываться.
Это и есть ниша генераторов пенсен, ну и корпорат музыка для бизнеса и генерация для инди игр и фильмов
>>986398 ибо это что-то уровня Бузовой/Нюши/прочей продюссерской параши Как будто их музыка что-то плохое. Уж не тебе судить где плохая музыка где хорошая, чмоня
>>986584 >главное чтобы было не скучно Из-за таких вот как ты у меня весь ютуб засран говновозом и тут еще есть такие же, которые срут подобным шлаком. Ебаное зумерье, вам лишь бы покекать хтьфу. Бог послал нам нейросетки чтобы даже безрукие могли выражать себя через творчество, а им лишь бы мемесы, поссал на вас
Сгенерил трек, случайно, на четвертой версии. Почему то на компе дали бесплатную десятку для аккаунта. Потом решил проверить, как он экстендом на три-пять подтянет партию. Партия в первом видео с 2:20 примерно, вторая результат экстендеда на три-пять. Они всё генерят на четверки и просто мылят для низших версий?
>>983280 Рассказывай. Раньше просто делал фейки в дискорде с помощью временных почт и Browsec расширения, теперь второе не работает, а диск ебаный сразу ругается на временные почты.
Ребят, я понял феномен сунодебилов - они слушают музыку либо в откровенно говняных наушниках либо даже без наушников вовсе, потому они буквально не слышат сунопердёж (вернее, для них пердёж в музыке - это норма). Очередное доказательство того, что видишь, что кто-то клепает в суно - видишь дебила без музыкального вкуса/ Когда слушаешь через жопу, действительно, разницы между удио и суно не слышно и суно кажется удобнее
>>986629 Как-то слишком качественно для суно. Если это новая версия, моё почтение - типичные для суно артефакты почти не слышны, но трек сам по себе говно
>>988269 >потому они буквально не слышат сунопердёж Может быть пердеж у тебя в голове непрерывный, а тебе кажется что это суно? Похвастайся своим вкусом, а заодно покажи че ты там в удио высрал, поржем.
>>988269 >феномен сунодебилов Дружище, ты переоцениваешь отношение к творчеству и качеству музыки созданного ИИ. Люди просто развлекаются и развлекаются творчеством, а иллюзии, что они творят что-то феноменальное или шедевральное, ни у кого нет. Не знаю, что у тебя там горит и что ты ожидаешь от развлечения масс и сырого ИИ, но тебе стоит подумать, что есть люди которые занимаются непрофессиональным спортом, танцами или живописью. Они получают удовольствие не от качества результата, а от занятия этой деятельностью.
>>984065 >"Хуем впидорасившись по яйца" в исполнении хора в сердечке - до слёз пробирает каждый раз соре, это тоже удио. СОбственно, поэтому годно и вышло. Хотя я был искренне уверен, что в суно сделано...
>>990176 Хит это только в твоём манямирке, хотя если быть честным, пролистав мельком плейлист 2024 года на сколько хватило сил, практически никаких хитов я там не обнаружил, в основной массе такой же женерик кал высранный как будто прямиком из удио, если не хуже.
>>990252 Чистая случайность, в 99% случаев просто песни или говорильни попадаются. А так роллил на сцуне этими тэгами: classical opera, aria, tenor, strong male chant, symphonical
>>992992 Ну, заходишь в Suno или Udio и чекаешь сотоварищей. Промтов на любой цвет и вкус наберешь. Как пример: indie pop, electropop, electronica, introspective, female vocals, emotional, downtempo, melodic, minimalistic clean electric guitar, bass guitar, melancholic, bittersweet,
Что-то последние пару недель на суно какую-то попсу выдает максимальную. Уже все промпты прошлые перебровал, которые давали нормальный рок/метал. А в итоге какая-то жуткая попса с одними барабанами из музыки.
>>993122 Запилить алгоритмы не сложно, проблема в вычислительных мощностях, поэтому в домашних условиях это сделать нереально. Для этого придется использовать сторонние сервисы для вычислений и соответственно оплачивать аренду.
>>993971 Ультрадорого. Одними алгоритмами не обойтись, сам процесс обучения потребует огромных ресурсов, так как нужно будет обработать огромные массивы данных. У той же Udio ушло на этот процесс несколько месяцев прежде чем пошла в продакшн. И по сей день, но уже с помощью обычных юзеров идет обкатка и совершенствование модели генерации.
>>994113 >Этого будет достаточно? В тренировке модели достаточно никогда не бывает, чем больше образцов, тем интереснее результат. По аренде просто рандомный сайт ткнул (пикрил), я ниразу таким не пользовался, но помоему не так уж и ультрадорого.
А вообще пробуй, если интересно, может даже не забросишь свой проект.
Я так подумал, из всех жанров только репчик больше всего подходит под аи в плане авторства, там все построено чисто на тексте и игре слов с рифмами, когда в других жанрах уже упор на вокал и музыку
>>996688 Не совсем. В шапке второй трек слушай, да и пару анонов тут неплохо делают женский, мелодичный вокал.
Тут просто ограниченность инструментов. Если бы у обычного пользователя был безлимит генераций и доступность последних версии - делали бы всё что угодно. Поймать интересные и живые интонации можно, собрать уникальный вокал и музыку тоже, но из-за ограничений импульс теряет интерес. Поэтому и создается впечатление узкой направленности.
Как-то через жопу у Suno приложуха работает, пытаюсь авторизоваться - перебрасывает на сайт, где висит кнопка Complete Redirect и ничего не происходит если ее жать. Просто страничка перезагружается.
Суно 4 приятную музыку делает во всех жанрах в удио можно делать всякую жесть и уникальное звучание, оператный вокал и тд, но большинство генераций особенно на русском противно слушать
>>977058 Приказал сочинить песню в стиле группы "Queen" про журналиста, который пошел брать интервью у президента США, а тот на его глазах начал превращать в рептилоида. В оригинальной версии откуда-то появился мат, его пришлось отредактировать ("What the fuck is this" на "What the hell is this" и т.д.), а так почти без редактуры.
В конце трек стилистически пошел куда-то в сторону Green Day.
сделал трек из двух понравившихся кусочков от Suno, но я не умею этот монтаж и все такое чтоб переходы заметны не были. есть нейросеть, которая умеет объединять красиво?
>>1001211 >не умею этот монтаж и все такое Скачай Audacity, там в общем все банально. Только у тебя все равно будет несостыковка, темп и настрой разный, посередине быстрая яма. Скинь два полных трека.
Сделал драйвовый индастриал-трек в Удио на свой текст (видеорел), скачал в mp3, последние две недели периодически слушал. Внезапно сегодня Виндоус медиа плеер начал отображать индуистскую иконку в треке, а название поменял с "Kali Yuga", на "Grotus - Slow Motion Apocalypse - Kali Yuga". Я погуглил что это - малоизвестная калифорнийская индастриал-метал-группа начала 90-х, у них есть трек с таким же названием, что и мой, но и по звучанию, и по тексту он совсем другой:
>>1005194 >Виндоус медиа плеер >поменялась сама собой и почему раньше она не отображалась? Что это за глюк интересно? Вытащи пару зондов из жопы. А то потом будешь удивляться как ты на нарах очутился и что это за глюк такой.
1. Девственность давит могильной плитою Душа кричит, не знает покоя В оковах чистоты, я словно прокажённый Желанием томим, но миром отвержённый Тело жаждет, крыша съезжает Неутоленная страсть изнутри сжигает Общество смеется, я - изгой Невинность до гроба - удел мой
Припев. Девственность давит! Душу терзает! Плоть пылает! Любви желает! Девственность давит! Кровь закипает! Разум страдает! Без любви погибает!
2. Тьма поглощает, надежда угасает Пустота меня изнутри сжирает В объятьях целомудрия я медленно тону Мечтая разорвать невинности тюрьму Одиночество грызёт, как червь могильный Желание растёт, становясь всесильным Невинности ноша чертовски тяжела Так жажду познать женского тепла
3. Когда же я сброшу этот груз? Когда познаю страсти вкус? Оковы невинности разорву И в бездну страсти с головой нырну
>>1008268 >slow otherworldly, dark, cold, dope, skweee, lucid dreaming, minimalism, drone, Roland TR-808, sub-bass, modulated vocals, modular synthesizer, sad, tragic, deep female voice >slow otherworldly, cold, skweee, lucid dreaming, minimalism, drone, 808, sub-bass, modulated vocals, sad, tragic, drawn-out, echo, decay, mechanical, dense, glassy, tunes, deep female voice Если хочешь более направленного результата - генери семпл-трек. Текст предполагаемого окраса музыки, а дальше экстендедами. Или даже ручками сшивать внешними программами, внутренний редактор просто убожество.
>>1010433 Качественно не улучшишь сторонними, максимум улучшение между внутренними версиями. Судя по ремиксам между версиями - информация хранится в отдельных дорожках, а возможно даже и семплах. А вот тебе она дается одним массивом - стереотреком, из двух дорожек, в котором не только инструментальные партии в одном полотне, но и голос. Понижая и повышая частоты, ты будешь работать со всей информацией и одинаково взаимодействовать, и на музыку, и на голос. Так и в остальных корректировках. Мастертрэк нужен.
Новая суно провал, на вторую версию удио даже и намека нет, о нейронке от 11лабс вообще все забыли, опенсорс версий не предвидится. Все очень хуёво, я думаю что мультимодальные ллм скорее продолжат улучшать качество генерации музыки уже. Большинству на это похуй походу
Пацаны, возможно запилить трек с голосами блохеров на имеющейся минус Голубой луны? Rhyker Hackarry47: Слышал я один инсайдик... О двух блогерах рассказ... Вроде стрим, а может сказка... Логотип сменили раз...
Был Виталик очень жадный, И решил он - ну а шо! Надо мне жену свою пристроить, Пусть поучит фотошоп! Он её назвал дизигнееер... Ведь не лучше остальных... И сказал, склепай мне логотип попроще, Шоб на кружечки лепить!
Популярность была Тому виной В комментариях бузили... А в Китае сказали - Нам-то пох, Вы ж за это заплатили!
>>1011136 сделать то можно, просто ебли дохуя. сначала надо сделать кавер в суно (минусовка, кстать, не покатит, суно надо по мелодии голоса отталкиваться, чтоб вокал делать) потом сделать образы голосов, потом отделить вокальную дорожку от минуса, порезать её по голосам, и накатить сверху образы голоса. а потом собрать всё вместе никто чисто за идею тебе ничего делать не будет, потому, придется осваивать всё и пилить самому, ну или забашлять кому.
>>1011848 Блять, как вы это суноговно жрете? Каждый высер максимально дефолтно-попсовая хуита с голосам рта полным хуев. По ошибке открыл, повелся на превьюшку квадратную.
Сука я вчера потратил все V4, буквально прописывая >философский серьезный двухаккордный акустический русский постпанк думерский построк с прокуренным равнодушным голосом о войне
Суно мне на всех генерациях выдало однотипную попсу аля Dabro с голосом Шамана нетраханного пидора в период течки. Сука, что может быть противней в мире, чем кокетливые завывания мужика?
https://suno.com/@revolutionarycritic7541 - я попробовал много разного, включая v2, у него все-равно выходит смесь попсы и кальянного пацанского рэпа. Как объяснить суно за 200 символов, что я не шкуру клею?
На платном такая же жопа?
(в удио на пробной версии вообще не слушабельное говно с голосом робота)
>>1012636 >выходит смесь попсы и кальянного пацанского рэпа Там принцип генерации не до конца понятен. Из субъективного - он создает музыку и голос и из тегов и из текста. В какой очередности непонятно, но видно, что эти оба контекста влияют на конечный результат. И плюс еще сверху пытается это все свести, то есть ему еще с ритмом приходится решать. Можно расстараться с тегами и генерировать тяжелую музыку, но детские стихи наполненные "примитивными", теплыми, детскими словами придаст конечному результату свой оттенок.
Там еще и подкручивают. У меня например раньше в тегах был акцент на женский голос, и мужской выпадал в двух из десяти вариантов. На любом мужском тексте. Сейчас это прямо даже сложно получить, даже если дублируя в окне текста указание пола голоса.
Ну и кормили и генерят-обучают его попсой, за счет доступности всем и трендовости развлечения. Мечтаем о локальной модели.
>>1014065 >Из субъективного - он создает музыку и голос и из тегов и из текста звучит убедительно. Но Написал мужицкий-абьюзерский текст в лирик аки от лица маркаряна. Один попал в десятку, второй - смесь пацанской попсы EDM (при том, что в промте было про гитару и альтернативный рок)
>Ну и кормили и генерят-обучают его попсой, за счет доступности всем и трендовости развлечения. Мечтаем о локальной модели.
>>1015388 подскажи, плз, перепев на русском через ремикс работает, как на пике?
>>1015445 я к тому что имея доступ ко всем жанрам, 90% просят ии генерить попсу, и вероятность того, что суно загенерит тебе попсу выше чем, например, он же загенерит йодль
>>1015618 слова не самые крутые, согласен. это была попытка оживить гитарную песню друга, сьебавшего на войну. Под два аккорда она звучит жизненно, а под аранжировку как в фонотеке - максимально кринжово
>>1015390 Не берусь судить, как они учат модель. Предполагаю, что они с Сони или Эплом, или еще с кем то, подключают модель к библиотекам коммерческой музыки. Для начала это оптимальнее для обучения, ИИ все равно на данном этапе имитирует деятельность, а не создает новое, и дополнительный инструмент отбора и осмысления будет тормозить развитие. Весь интернет же не структурирован, разнороден, не классифицирован и не имеет оценок.
>>1015343 >Написал мужицкий-абьюзерский текст в лирик аки от лица маркаряна. Один попал в десятку, второй - смесь пацанской попсы EDM (при том, что в промте было про гитару и альтернативный рок) Тут предположу ограниченность доступа, выборки и понимания русскоязычной музыки. Для тебя и меня понятно, что ты хотел, для западных разработчиков это усреднённое понимание, ограниченное инородностью культуры и доступом к музыкальным библиотекам.
>>1020877 Везде, и даже в тексте, прописывать и молится. Вообще им давно уже надо два поля тегов делать, а лучше даже расстановку интонации, протяженности, пауз, нескольких голосов и другого, прямо в тексте.
>>1012369 В удио смешение инструментов порождающей новые звуки, работа с эффектами годная, хорошие, не типовые ходы в аранжировках, естественный голос. Хули сравнивать, это небо и земля.
>>1025205 Звучит скучновато, как неизобретательная декламация под ритм без изюминки. Кстати, хинт, чтобы удио делал музыку с изюминктй, надо вручную (не в чатгпт) подготавливать куплет таким образом, чтобы он очень сильно выбивался из ритма остальных четверостиший, например, состоял буквально из нескольких слов.
>>1025177 >есть ли надежный способ? Ну вроде можно по ролям петь, но наверное нереально пока. Проблема в выборе музыкальной партии он каждому - рандом. Проблема в результате каждого голоса - он может быть рандомным и не желанным, как относительно первого голоса, так и относительно своего смысла. Тут только генрировать, вибирать и сшивать. Прямо нереальный мутор.
>>1025189 >>1025534 Формулируйте более четче, не всем понятно, что конкретного вы хотите. Есть косвенная методика - идете по музыкальным критикам и читайте их литературные захлебывания про альбомы или конкретные треки. Из них можно выделить теги.
>>1026010 Суно всё равно больше 3-4 не скомбинирует, причем первые сильней, последние уже вяленько. Да и он дохуя не понимает, нужно смотреть тег-лист именно суно и комбинировать с того что есть.
>>1029955 >On an H800 GPU, generating 30s audio takes 150 seconds. On an RTX 4090 GPU, generating 30s audio takes approximately 360 seconds. По несколько минут ждать огрызок, проще подождать пару лет ещё.
>>1034233 >>1034258 говно. Ты просто ёбаный школьник дорвавшийся до технологий который сразу побежал писать слово ХУЙ на заборе. Сдохни мразь и больше никогда не трогай нейросети.
>>1034984 Конечно, чем больще игроков, тем лучше, и эта риффузия действительно работает, но есть серьезный минус, состоящий в том, что в ней не отключить "улучшение" промпта, в результате мелодии получаются слишком рандомными.
Повертел новинку, из минусов то что порой целые куски зажевывает и в сравнении с Suno видно как ей русский дается с трудом пока что. Радует инструментарий по редактированию и каверам прямо из коробки, надеюсь не перенесут это в премиум в дальнейшем.
>>1038505 *фильтр у их обоссаной лллм я легко обошел, но кал калыч: в промпте четко указано женский вокал + тяжелый митол, в итоге 25 роллов говна с бабской папсой, либо дженерик мужским металлом, слайдеры нихуя не помогают как их не дрочи, совершенный рендом. Нормальный получился только один припев у песни и куплет боль-менее (всё равно мужской вокал), вырезал кусок и скормил суно сделав нормально. Рифьюжен сырой очень.
>>1038566 Там даже не маты: В топке печи набиты трупы упруго. Причем таких строк в песне отсилы 20%. У меня с суно один раз была такая же хуита, когда я туда что-то анатомическое кинул в духе каннибал корпс, но там я тоже смог обойти.
>>976047 (OP) Вообще шапка говно протухшее, она уже 7 тредов неактуальная, добавьте: opensuno (вроде так называлось, щас не могу загуглить, пользовался полгода назад), вроде как локальная модель, но там был сайт, кирилицу не поддерживал, но английский текст генерил ХАЛП ПОМОГИТЕ НАЙТИ ПРЕЛБАЛ ССЫЛКУ есть говномодель от стабл диффужен, тоже не помню какназывается, в голос вообще человеческий не может, но генерит инструментал неплохо а вот нашел https://stableaudio.com/ это выше упомянули https://github.com/multimodal-art-projection/YuE китайский английский вокал, лоКАЛьно НУ РЕФЬЮЖЕН тоже еще теперь https://www.riffusion.com/ суно для бедных, может в русский, плохое понимание промпта, стили очень общие
>>1038569 *три часа и готово. В суно после выхода v4 я так понимаю сломали специально возможность клонировать через экстендед, если раньше хоть и на низком качестве - выдавало идентичное, пусть и съезжающее через 60 сек, то теперь просто какой-то дикий рендом, с 10 бесплатных в4 рольнул 1 (один!) с нормальным припевом как в рифьюжене было, и вырезал оттуда 2 куплета, которые в рифьюжене были галимейшей попсой, всё остальное просто кал и мусор. При ближайшем сравнении всё же у в4 качество и чистота звука ниже чем у рифьюжена. На в3,5 вообще кал говна был, даже не похоже. Короче, если один жанр ставить довольно известный, то рифьюжен конечно лучше чем суно, но то что натренирован на говнопопсе и всюду её сует - это гигантский минус.
Бля а можно как то продлить песню или просто на мелодию сделать новую? Я лютый шин словил в рандомной песне, с теме же тегами не получается такая мелодия(
>>1038596 > есть говномодель от стабл диффужен, тоже не помню какназывается, в голос вообще человеческий не может, но генерит инструментал неплохо а вот нашел https://stableaudio.com/ Она в целом интересна только тем, что Stability AI выкатили к ней тулзы для тренировки, включая возможность тренировки с нуля на разных архитектурах. Но сама по себе SAO не более чем любопытный концепт, который не может генерировать песни по заданному тексту by design, т.к. там весь текстовый ввод кодируется всего-лишь одним T5 эмбеддингом, который пытается извлечь смысла из текст, в то время как для аудио надо вообще извлекать фонемы (солнце -> со́нцэ), поскольку аудиоген это не LLM или картинкогенератор, тут смысл отдельных фраз вообще не важен.
Там, на самом деле, ещё датасет очень слабый, с большим фокусом на рандомные звуки, а не на песни/музыку, поэтому оно не может обработать какие-то сложные запросы с миксом разных концептов. Условно, ты можешь попросить её сгенерировать обычный металл, но симфонический металл она уже не осилит.
При этом сама SAO вышла ещё весной 2024 и не получила каких-либо известных тьюнов и не сыскала популярности в оригинальном виде.
Я считаю, что нет смысла добавлять конкретно SAO в шапку, поскольку она может быть интересна только тем, кто хочет что-то своё запилить/затьюнить. В текущем виде оно просто неюзабельно.
> это выше упомянули https://github.com/multimodal-art-projection/YuE китайский английский вокал, лоКАЛьно YuE точно стоит добавить, это буквально первый проект который может генерировать песни по заданному тексту локально. Но есть нюансы.
https://github.com/alisson-anjos/YuE-Interface Из других нюансов то, что пока не запилили какой-то общепризнанный GUI для него, так что в оригинальной репе предлагают все операции делать через консоль, но есть и какие-то сторонние GUI запиленные энтузиастами за последнюю неделю.
В общем, всё пока сырое, но в отличии от SAO у этого проекта есть все шансы взлететь. Я бы пока просто ссылку на оригинальную репу в шапку вставил, поскольку пока непонятно, что из связанного с этим проектом инструментария будет актуально, скажем, через месяц.
> opensuno (вроде так называлось, щас не могу загуглить, пользовался полгода назад), вроде как локальная модель, но там был сайт, кирилицу не поддерживал, но английский текст генерил ХАЛП ПОМОГИТЕ НАЙТИ ПРЕЛБАЛ ССЫЛКУ Хз, первый раз слышу, сейчас под этим названием гуглятся только какие-то обёртки для YuE. Скинь инфу если найдёшь тот старый проект.
> НУ РЕФЬЮЖЕН тоже еще теперь https://www.riffusion.com/ суно для бедных, может в русский, плохое понимание промпта, стили очень общие Это да, возможно имеет смысл отдельно ссылку на доки ещё добавить, там пояснения как промпт грамотно составлять и прочее: https://www.riffusion.com/docs
>>1038596 >НУ РЕФЬЮЖЕН тоже еще теперь https://www.riffusion.com/ суно для бедных, может в русский, плохое понимание промпта, стили очень общие На русском не вкуривал ещё, а вот инглиш даже по промту текст генерит неожиданно неплохой, нуждающийся в минимуме правок. Плюс анальной цензуры нет [пока].
>>1039606 >Я бы пока просто ссылку на оригинальную репу в шапку вставил Что шапка настолько большая что туда САО и уеу одновременно не влезут?! Пиздец!
>>1039674 Можно и добавить, но тогда стоит сразу же добавить ремарку, что SAO не подходит для генерации песен по тексту и обладает низким качеством по сравнению с другими решениями.
В противном случае, ньюфаги будут пытаться её запустить и спрашивать в треде почему выходит хуйня, отнимая своё и чужое время.
>>1038596 >https://stableaudio.com/ Неплохо, хаусец и электронику можно писать, но количество генераций закрывает вопрос использования. А платная без голоса бессмысленна. И экстендедов нет.
В общем хотел рифьюжн похейтить после ужаса что он мне выдал на русском, но вчера что-то решил побаловаться на нем с промптами для инструментала, и не заметил, что тут надо чисто для музыки переключатель включить даже если лирику не пишешь. В итоге он мне нагенерировал песенок и внезапно при прослушивании некоторые на английском вполне неплохо звучат. Решил сделать хитрый финт и взять песенки что он нагенерил под мой промпт и переделать их на русский и так сгенерировать. И внезапно, некоторое стало не так плохо звучать, ещё и всякие эффекты бэка работают. Текст конечно от рифьюжн такой себе, но для русского звучит не так плохо ещё и какие-то там всякие эффекты есть. Короче позоонаблюдаю за его развитием если оно будет и пока халява побалуюсь с генерациями.
Итак, насколько я понял, эта штука очень чувствительно к genre-промпту. Так же, она очень плохо умеет в темп и генерит в среднем по одной секции ([verse], [chorus], [bridge] [outro]) в один сегмент (max_new_tokens / 100 = 30 сек по дефолту). Поэтому, надо либо уменьшать размер сегмента (вместо 3000 токенов ставить меньше), либо слеплять секции (куплеты) в один. У Суно я не наблюдал такой проблемы, она спокойно генерила как быстрые, так и медленные мелодии. А тут приходится колдовать самому. При этом, гарантии все равно особо никакой, музыки может и не случиться.
В общем, не самая хорошая модель, хотя именно качество, если повезет, получается и неплохое. Для первой локальной модели.