Чарт с ними. Как ИИ меняет музыкальную индустрию
В сентябре 2016-го интернет облетела новость об очередном шаге человечества навстречу технологической сингулярности: искусственный интеллект впервые сочинил полноценную песню «как у The Beatles». Ученые из парижского филиала компьютерной лаборатории SONY CSL Research Lab сообщили о том, что их AI-система Flow Machines создала трек под названием «Daddy`s Car», проанализировав 45 песен великой группы. Предъявленный миру результат не был похож на песню Леннона-Маккартни — скорее на старательное подражание их подражателям. Благосклонные комментаторы в интернете говорили, что «Daddy`s Car» звучит как гибрид Electric Light Orchestra и Tame Impala. Впоследствии выяснилось, что «первая песня в мире, целиком сочиненная AI», была доведена до ума человеком: вокал и аранжировка принадлежали французскому музыканту Бенуа Карре, работавшему под псевдонимом SKYGGE. Через год Бенуа Карре выпустил под шапкой этого проекта альбом «Hello World», который подавался как «первый в мире поп-альбом, сочиненный с помощью искусственного интеллекта». В его создании, помимо системы Flow Machines, участвовали еще два десятка музыкантов, среди которых бельгийская звезда Stromae и номинант на премию Mercury Music Prize, шотландский бард C Duncan. Стало понятно, что наступление технологической сингулярности пока откладывается: нейросети все еще не обходятся без людей.
Шли годы; AI-системы становились мощнее и самостоятельнее. В 2019-м впервые в истории индустрии звукозаписывающий гигант Warner Music Group подписал контракт на 20 альбомов… не с живым музыкантом, но с приложением генеративной музыки для релаксации и сна Endel — стартапом, придуманным россиянами. В 2020-м калифорнийская компания OpenAI, получившая инвестицию в миллиард долларов от Microsoft, представила свою музыкальную нейронку Jukeboх AI. Среди треков, демонстрирующих возможности системы, была еще одна песня «как у The Beatles» — композиция, напоминающая нечто среднее между психоделическими флуктуациями «Tomorrow Never Knows» и детским вирусным хитом «Baby Shark». По оценкам слушателей, она тоже ни в какое сравнение не шла с эталонами ливерпульцев, но все же была уже выполнена целиком без участия человека — в том числе сгенерирован был имитирующий Пола Маккартни вокал. Трек оставлял по-хорошему безумное впечатление музыки, сделанной принявшим кислоты роботом.
В 2023-м сам Маккартни вместе с Ринго Старром использовали нейросеть для того, чтобы записать и выпустить последнюю песню в истории The Beatles. Сингл «Now and Then», вышедший в минувшем ноябре, был основан на эскизном тейке, сделанном Джоном Ленноном в 1977 году. AI-система MAL, разработанная для фильма Питера Джексона «The Beatles: Get Back», помогла отделить и восстановить голос Леннона со старой демокассеты. Маккартни сделал к вокальной линии аранжировку, гитарную партию Джорджа Харрисона достали из студийных архивов. Круг замкнулся: ИИ все-таки помог сделать песню «как у The Beatles» и доказал, что он может быть полезным и даже незаменимым инструментом для создателей музыки.
В наши дни повального увлечения ChatGPT и Midjourney сообщения об успехах музыкальных AI-систем уже не выглядят чем-то сногсшибательным. Несмотря на то, что производство генеративной музыки все еще остается делом ресурсоемким и дорогим, музыканты и продюсеры используют нейросети гораздо чаще, чем нам кажется. В первую очередь музыкальные нейронки научились имитировать человеческое пение и уже могут производить убедительные цифровые клоны известных артистов. Голосовых дипфейков становится все больше, и треки, использующие их, готовы к прорыву в мейнстрим. Год назад, в апреле 2023 года, вирусным хитом в TikTok стал трек «Heart On My Sleeve», где звучали голоса двух суперзвезд — Drake и The Weeknd. Быстро выяснилось, что артисты не имели к этому треку никакого отношения: его спродюсировал анонимный гострайтер, использовавший ИИ для имитации вокала. Случился скандал — Drake и его лейбл Universal были возмущены. Трек начали изымать, однако он всплывал в интернете в новых аккаунтах снова и снова и собирал свои сотни тысяч прослушиваний. Инцидент с «Heart On My Sleeve» встревожил индустрию, осознавшую угрозу сложившемуся порядку и собственным доходам. Кому пойдут отчисления за прослушивания трека, сделанного неизвестным продюсером и цифровой имитацией Drake, если вдруг он оказался лучше и популярнее, чем у Drake? Эта история получила продолжение в апреле 2024-го: сам Drake, который не упускает ни одного модного тренда, выложил трек «Taylor Made Freestyle», где использовал сгенерированные куплеты Тупака Шакура и Snoop Dogg, чтобы подраскачать медийную волну вокруг своей перепалки с Кендриком Ламаром.
Идея «воскрешать» популярных и культовых вокалистов с помощью AI, записывая им новые треки, носится в воздухе. Например, хип-хоп-продюсер Timbaland заявил о намерении выпустить целый альбом, в котором будет звучать AI-клон другого знаменитого рэпера — Notorious B.I.G. Его замысел встретил резкую критику как со стороны поклонников легендарного гангста, так и со стороны представителей индустрии, поскольку в их глазах в такого рода цифровом воскрешении есть и этическая проблема, и проблема авторского права. Timbaland, однако, считает, что не надо усложнять: ИИ-реконструкции — всего лишь перспективная технология для музыкальной индустрии, и скоро она войдет в нашу жизнь повсеместно, как автотюн в начале 2000-х.
Среди мыслящих схожим образом AI-энтузиастов, например, Grimes: канадская певица, привыкшая быть на фронтире технологических инноваций, сделала публичное заявление о том, что приветствует манипуляции с ее голосом в любых ИИ-композициях и готова по-товарищески делиться с авторами таких треков половиной гонорара. Нельзя сказать, что примеру Grimes последовали артисты, чьи песни занимают в хит-парадах места повыше.
Новые возможности, которые AI открывает перед людьми в музыке, больше всего интересуют продюсеров, занимающихся экспериментальной электроникой: свои коллаборации с нейросетью делали выпускница Стенфорда и убежденная сторонница хай-тека, американская певица и продюсер Холли Херндон, немецкие idm-классики Mouse on Mars и лондонский резидент лейбла Hyperdub Ли Гэмбл. Конечно же, таких артистов меньше всего интересовали возможности ИИ по производству реплик звездных голосов; их проекты-альбомы концептуально осваивали возможности сотрудничества человека и машины, выходя даже на уровень философского осмысления границ этого симбиоза.
Но гораздо большее число известных музыкантов относятся к прогрессу музыкальных AI-систем со скепсисом и настороженностью. В апреле 2024-го американская юридическая ассоциация Artist Rights Alliance опубликовала открытое обращение к технологическим компаниям с требованием остановить разработку ИИ-продуктов, копирующих вокал и саунд артистов и тем самым способных вытеснить их из бизнеса. Письмо подписали более двух сотен известных музыкантов, среди которых Билли Айлиш, Ники Минаж, Стиви Уандер и R.E.M., а также фонды, управляющие каталогами Фрэнка Синатры и Боба Марли.
Немало экспертов из индустрии, однако, полагают, что такого рода обращения уже ничего не изменят. Прогресс невозможно остановить: музыкальные нейросети становятся мощнее и доступнее, и, развиваясь, они будут предлагать новые инструменты не только для продюсеров и сонграйтеров, но и для самой широкой аудитории. Уже сейчас мы наблюдаем разворачивающуюся конкурентную борьбу среди AI-генераторов музыки по текстовым описаниям — между поддержанной Microsoft платформой Suno и приложением Udio, среди инвесторов которого замечены неоднократные лауреаты «Грэмми», рэпер-активист Common, а также певец и продюсер Will.i.am, создавший Black Eyed Peas.
Действительно ли Стиви Уандеру и Билли Айлиш есть чего бояться? Получив широкое распространение в ближайшие несколько лет, музыкальные нейросети, несомненно, изменят расстановку сил в звукозаписывающей индустрии и, возможно, приведут к сокращению рабочих мест. Однако самой уязвимой категорией профессионалов эксперты называют сейчас звукоинженеров, техников и даже продюсеров. Предсказывают, что в ближайшем будущем AI будет делать всю «техническую» работу по созданию музыки — он будет анализировать, обрабатывать, сводить, микшировать, ремастерить и записывать. Возможно, он также будет подсказывать человеку неожиданные ходы, повороты и решения при создании музыки. Вслед за другими технологическими инновациями, от микрофона до семплера и mp3, нейросети продолжат демократизировать процесс создания музыки, сделав его еще более доступным для людей. Но они никогда не смогут полностью заменить человеческую фантазию и индивидуальность.