Centrum informačních technologií FF

Nástroje pro automatickou tvorbu hudby

Umělá inteligence může být skvělým pomocníkem v kreativním procesu. I v tom hudebním. Hudebníkům všech úrovní mohou AI nástroje nabízející řadu užitečných funkcí pomoct s generováním originálních melodií a usnadnit tvorbu nového hudebního obsahu. Přečtěte si, jaké možnosti nabízejí nástroje Magenta, AIVA, WaVeNet a další.

18. 4. 2024 Kateřina Hendrychová

Magenta 

Magenta, projekt vyvinutý v rámci Google Brain Team v roce 2016, je pravděpodobně nejznámějším systémem pro autonomní generování hudby, který je založený na symbolické reprezentaci dat (MIDI). Svou první melodii o délce 90 sekund složil v tomtéž roce. Projekt se zaměřuje na výzkum strojového učení nejen v oblasti hudby, ale také designu. Magenta je vhodná i pro vizuální umělce, větší část ale tvoří modely a nástroje právě pro hudebníky. Cílem projektu je vytvářet nástroje, které umožní hudebníkům produkovat kvalitní a přesvědčivý umělecký obsah. Uživatelé mají možnost si software upravovat a přizpůsobovat podle vlastních potřeb. Vývojáři software navíc neustále vylepšují a přidávají nové funkce a nastavení. Magenta pro každý model poskytuje tzv. softwarový balíček, který je naučený na velkém množství MIDI souborů. Díky těmto vyškoleným modelům mohou uživatelé okamžitě vytvářet hudbu. Magenta používá open source knihovnu pro strojové učení TensorFlow. Přelomovým rokem pro projekt se stal rok 2018, kdy Magenta začala poskytovat interaktivnější dema i v JavaScriptu (předtím v Pythonu) a vytvořila také Magenta Studio – sadu hudebních nástrojů pro jeden z nejpoužívanějších DAW programů, Ableton Live. Tyto nástroje, které umí například generovat melodie, bicí nebo je kombinovat na základě existujících záznamů, tak uživatelům usnadnily práci spojenou s kompozicí hudby, nahráváním, ale také postprodukcí. Kromě toho zvládnou také upravit rytmické stopy, aby zněly víc „reálně“, nebo vytvořit bicí přímo k vymyšlené basové lince nebo melodii. Základem všech nástrojů projektu byly nejprve rekurentní neuronové sítě, v roce 2018 je však nahradil model Music Transformer, který využívá konvoluční neuronové sítě SANMusicVAE.

AIVA (Artificial Intelligence Virtual Artist)

V roce 2016 vznikl také další AI startup v oblasti hudební produkce a distribuce - AIVA (Artificial Intelligence Virtual Artist). Projekt je zaměřený na klasickou hudbu a uživatelům pomáhá tvořit personalizované skladby či soundtracky. Používá algoritmy hlubokého učení a umělé inteligence. Jako vstupní data pro trénink sítě zvolila firma AIVA Technologies klasická díla nejznámějších autorů, jako je Mozart, Beethoven nebo Bach. Systém analyzoval bezmála 30 000 skladeb autorů od baroka až po 20. století. První hudební kompozici pro sóla piana vytvořila AIVA v roce 2016, od té doby vydala další dvě alba. V roce 2017 byla AIVA společností SACEM oficiálně uznaná jako první virtuální skladatel.

Další úspěch projekt slavil v roce 2017, kdy byl společně se startupem Virtelio vybraný ke spolupráci s Evropským filmovým trhem v Berlíně. AIVA je známá také díky svému počinu s názvem AIVA/Dvořák: From the Future World. Na základě 115 Dvořákových skladeb AIVA dokomponovala nedokončený fragment díla Antonína Dvořáka nalezený v Českém muzeu hudby. To pro ni nebyl snadný úkol, protože jak zmínil spoluautor projektu Richard Stiebitz, Dvořákova hudba není tak předvídatelná jako jiná. Samotné komponování jí zabralo týden, zpracování 115 opusů asi měsíc. Výsledkem je nová skladba o třech větách, která je podle Stiebitze majestátní a vyvolává emoce. Poslechněte si, jak tato skladba zní v podání orchestru PKF – Prague Philharmonia.

WaveNet

Hluboká neuronová síť od britské společnosti Deepmind vznikla v roce 2016. WaveNet umožňuje generovat realistický zvuk, a to včetně lidské řeči. Učí se z rozsáhlých datových sad zvukových nahrávek – data zahrnují lidskou řeč, hudbu a další typy zvuků. WaveNet funguje na základě konvoluční neuronové sítě. Původně bylo hlavním cílem modelu vytvářet hlasové signály (mluvené slovo) z textu. WaveNet se používá k vytváření dialogů pro chatboty či k personalizaci hlasových asistentů, technologii využívá například Google Assistant nebo aplikace pro výuku jazyků Duolingo.Díky tomu, že se jedná o flexibilní model, lze ho použít také pro generování nového hudebního obsahu. Tým Deepmind síť vytrénoval na datasetu klasické klavírní hudby. Výsledkem jsou desetisekundové klavírní skladby, které si můžete poslechnout tady. Za zmínku stojí také experiment Rachel Chenové, Kylea Griera a Dannyho Sutanta, kteří využili tento model pro skládání ambientních skladeb.

Flow Machines

Výzkumný projekt společnosti Sony CSL zaměřený na rozšíření kreativních možností hudebníků a skladatelů vznikl v roce 2019 díky vedení Françoise Pacheta. Webová aplikace FlowComposer je hlavním nástrojem Flow Machines. Je založená na strojovém učení a kombinuje symbolický a distributivní způsob reprezentace. FlowComposer se odlišuje od jiných systémů pro generování hudby tím, že se zaměřuje na napodobování a variaci stylu konkrétního umělce. Místo plně automatické tvorby skladby umožňuje program uživateli aktivně se zapojit do procesu a ovlivnit tak výsledný zvuk. Uživatelé s FlowComposerem netvoří celé skladby najednou, ale spíše generují krátké úryvky, které pak mohou dále upravovat, kombinovat a sestavovat do kompletních skladeb. Program tak slouží jako nástroj pro inspiraci a podporu tvůrčího procesu. Právě Flow Machines je často označovaný jako první AI nástroj, který vygeneroval píseň. Jedná se o píseň ve stylu Beatles s názvem Daddy’s Car, kterou za pomocí FlowComposer složil francouzský skladatel a producent Benoît Carré.

Amper Music 

Za Amper Music stojí hollywoodští filmoví skladatelé Drew Silverstein, Sam Estes a Michael Hobe. Nástroj navrhli v roce 2014, v současné době však už nástroj nefunguje. Webová aplikace ale fungovala velmi jednoduše a byla tak přístupná i těm uživatelům, kteří nemají žádné odborné znalosti a dovednosti potřebné pro tvorbu hudby. Díky tomuto nástroji pro skládání hudby s umělou inteligencí se vám podařilo vytvořit skladbu i bez studia plného hudebních nástrojů a techniky. Stačilo si stáhnout aplikaci a založit účet. Pak už jen vybrat žánr, náladu a délku budoucího díla. K analýze zadaných parametrů a vytvoření skladby „na míru“ využíval nástroj Amper Music kombinaci neuronových sítí a algoritmy strojového učení. Nástroj byl oblíbený také u hudebníků a umělců – při tvorbě svého alba I Am AI si ho vybrala americká zpěvačka Taryn Southernová. Do mnoha světových žebříčků se pak dostala skladba Most Motivational Song Ever, kterou vytvořila australská zpěvačka Betty Who právě ve spoluprací s Amper Music.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.