Centrum informačních technologií FF

V našem projektu se pokoušíme lépe porozumět hudbě, říká Lubomír Spurný

Software MemoVision slouží ke zkoumání zvukové podoby hudby. Do českého prostředí přináší pokročilé a částečně automatizované metody zpracování větších objemů dat vztahujících se k hudebně-interpretačnímu výkonu. Vznikl díky multidisciplinární spolupráci, na které se podíleli výzkumníci z Masarykovy univerzity, Vysokého učení technického a Národního muzea. Jak software funguje a pro koho je vhodný? Přečtěte si rozhovor s řešitelem projektu Lubomírem Spurným, kteří hovoří o projektu Paměť zvuku a softwaru MemoVision.

26. 2. 2024 Kateřina Müllerová

Pane profesore, můžete prosím představit projekt Paměť zvuku?

Jestliže dříve pracovali muzikologové s dílem textově kodifikovaným (partitura), pak naše práce posouvá tento zájem ke znějící formě. Obrat můžeme vnímat jako sérií pokusů o reformu zavedených metodologických postupů, pramenící ze snahy proměnit tradiční historickou a filologickou orientaci oboru. V této souvislosti stojí za připomenutí, že interpretace díla byla (a částečně ještě je) považována v dějinách hudby a v evropské estetické tradici za věc druhořadou. Ostatně již samotný jazyk takový výkon marginalizuje. Výkonný umělec psané pouze reprodukuje, převádí syntax do zvukové podoby. Interpretační výkon je dovedností, pouhou hrou, která zde stojí proti vážné práci skladatele.

V našem projektu, jeho celý název zní Paměť zvuku: evoluční principy interpretační tradice české hudby na příkladu děl Antonína Dvořáka a Bedřicha Smetany, se obracíme k této druhé, častokrát opomíjené povaze hudby. Pokusili jsme se vytvořit (a také doplnit, poopravit a zdokonalit) analytické nástroje interpretačního výkonu. V řadě případů se jedná o výrazné inovace, jež vycházejí z vlastních zkušeností s hudební teorií a analýzou. A v neposlední řadě se znějící hudbou. Hudební profesionál či návštěvník koncertu si opakovaně kladou otázku, zda výkon, kterému jsou právě přítomni má parametry srovnatelné s výkonem, jehož byli návštěvníky před pár dny, či si jej v podobě zvukového záznamu vyslechli v klidu domova. Jak se o tom ale přesvědčit? Představme si například, že posloucháme naši oblíbenou skladbu ve dvou různých provedeních bezprostředně po sobě. Vcelku běžná věc, která nám leccos napoví. Záleží pochopitelně na délce skladby a naší muzikantské zkušenosti, co z toho jsme schopni si zapamatovat a přenést na následující poslech. Potom ještě přidáme provedení další, a znovu tento proces podstoupíme. Při třetím, pátém, popřípadě dvacátém a padesátém poslechu se budeme soustředit nanejvýš na detaily, budeme probírat způsob tvoření tónu nebo pojetí konkrétní fráze, a nakonec se v těchto zvucích ztratíme. Řešením je změnit podobu prezentace. Porovnat odlišné interpretace můžeme tehdy, převedeme-li je do vizuální podoby. Pro tento účel jsme vytvořili software MemoVision.

Výraz „paměť zvuku“ dává tušit, že analýzy děl uvedených českých klasiků se týkají výhradně zvukových záznamů. I když nelze popřít, že součástí hudebního provedení mohou být i jiné než zvukové informace, stále platí, že pro nás mají nespornou výhodu nahrávky, ať již v podobě studiového, či zaznamenaného živého výkonu. Právě ony, na rozdíl od přímého poslechu, umožňují detailní a opakované měření. Součástí našeho projektu byla rovněž práce na vytvoření rozsáhlé databáze hudebních nahrávek z děl Bedřicha Smetany a Antonína Dvořáka.

Kromě výzkumníků z Masarykovy univerzity se na projektu podílí také tým z Vysokého učení technického a Národního muzea. Jak jste navázali spolupráci s těmito institucemi?

Některé ze členů týmu jsem poznal již dávno před tím, než projekt vznikl. Myslím tím dobu, kdy myšlenka na zobrazení „konzervovaných zvukových objektů“ vznikala. Tým spolupracovníků byl důležitý nejen během trvání projektu, ale některé z nich jsem poznal již daleko dříve, tedy ve chvíli, kdy se celý nápad složitě rodil. Řešení jsem pak začal jasněji vnímat, když jsem získával informace potřebné k vyřešení technických problémů. Mám na mysli dobu zhruba před deseti lety. Tehdy jsem přišel za profesorem Zdeňkem Smékalem z VUT s nápadem vytvořit software odpovídající přibližně naší nynější realizaci. Kolega Smékal mi vysvětlil všechny těžkosti a snad i nepřekonatelné problémy s realizací, přesto neváhal sestavit tým z tehdejších studentů oboru a sám se pustil do práce na uskutečnění původního nápadu. Jeho kritické komentáře mě převedly přes řadu nejistot a vtiskly některým myšlenkám smysl a řád. Mezi budoucími členy týmu vynikal již tenkrát Matěj Ištvanek. Má původní myšlenka, jež byla daleko skromější než dokazuje nynější stav, byla realizována hlavně díky němu. Celý projekt je tedy završením desetileté spolupráce brněnských muzikologů s kolegy z Fakulty elektrotechniky a komunikačních technologií VUT v Brně. Za Ústav hudební vědy FF MU bych ještě rád jmenoval Kláru Mühlovou a Jana Karafiáta. Později byl pracovní tým rozšířen o spolupracovníky z Národního muzea (České muzeum hudby), o Filipa Šíra, Ivu Horovou a Martin Mejzra. Vytvoření analytického nástroje vhodného pro hudebně interpretační praxi by nebylo možné bez vyjádření zkušeného pianisty, jenž by výhody a nedostatky softwaru MemoVision posoudil nejen z vlastní zkušenosti, ale i pohledem cílových uživatelů. Připadlo mi proto logické přizvat v závěrečné fázi realizace projektu ke spolupráci pianistu Jana Jiraského (Janáčkova akademie múzických umění).

Jedním z výstupů je software pro analýzu interpretačního výkonu. Jaké je jeho zaměření?

Software MemoVision je nástrojem sloužícím ke zkoumání zvukové podoby hudby. Uvádí do českého kontextu pokročilé a částečně automatizované metody zpracování větších objemů dat vztahujících se k hudebně-interpretačnímu výkonu. Jednu z jeho možností si můžeme jednoduše představit jako jakýsi specifický elektrokardiogram, jako graf zobrazující rytmickou pulzaci, tempové změny a zvukově-dynamický průběhu skladby. Dostaneme jejich obraz. Není to věrná fotografie, ale jen určitá rekonstrukce individuální interpretace. Vizualizace průběhu tempa a dynamiky a jejich synchronizace s ostatními zvukovými záznamy téhož díla umožní adekvátní srovnání nekonečného množství záznamů na základě předem vybraných charakteristik.

Zcela legitimní je ptát se, proč právě tempo spolu s dynamikou, a ne například barva či výška tónu. Proč se nezabýváme zvukem nástroje, či jak tvoří interpret tón a zda jeho výkon neobsahuje intonační odchylky. Poslední z možností vlastně do úvahy brát nelze. V dnešních nahrávkách nebývají „falešné tóny“. Vše se dá totiž opravit. Taková nahrávka by proto nejspíš ani nevznikla. Nejen z řady studií zabývajících se podobným typem analýzy, ale i z obecné hudební intuice je zřejmé, že především čas, tedy tempo a jeho proměny, jsou klíčové při zjišťování daných interpretačních rozdílů. U dalších parametrů interpretace hraje důležitou roli skutečnost, že nemáme pod kontrolou nahrávací proces (např. výběr, vlastnosti a pozice mikrofonů při nahrávání), včetně použití řady efektů při postprodukci. Jednoduše řečeno, pokud sami nenahráváme a nevydáváme, nemůžeme zaručit, že nahrávky neprošly různou konverzí a formátováním.

„Součástí našeho projektu byla rovněž práce na vytvoření rozsáhlé databáze hudebních nahrávek z děl Bedřicha Smetany a Antonína Dvořáka.“

Lubomír Spurný, řešitel projektu
Hovoříte o synchronizaci nahrávek. Můžete popsat tento princip?

Pokusím se alespoň ve stručnosti tento proces vysvětlit. Součástí softwaru jsou databáze, zvukové záznamy interpretací jedné skladby, seřazené podle interpreta, data vzniku nahrávky s přiřazenou charakteristikou. Z databáze je odhadem vybrána referenční nahrávka, ve které se manuálně vyznačí tzv. referenční anotace, jakési záchytné body skladby. Pro náš typ hudby se jako nejvhodnější zdály být časové pozice taktů, tedy jejich první doby. Vytvoření anotací se provádělo ručně kliknutím myší a ve zpomaleném záběru byly jejich pozice zpřesněny. Zdánlivě jednoduchý proces ovšem není bez komplikací. Pro oblast technického zpracování zvuku představuje detekce nástupu tónu, naší zmiňované první doby taktu, specifický úkol, neboť pozice dob v partituře nemusí nutně korespondovat se slyšitelným nástupem hudební události. Například u bicích nástrojů či klavíru je nástup tónu daleko zřetelnější, než je tomu u smyčcových a dechových nástrojů.

Následujícím krokem při zpracování je tzv. audio-to-audio synchronizace. Ručně provedené anotace referenční nahrávky se přenesou na všechny ostatní zvukové záznamy databáze. Synchronizace hudebních nahrávek probíhá metodou tzv. časového zarovnání, kdy jsou hodnoty jedné reprezentace přiřazeny k hodnotám druhé. Nahrávky se od sebe sice mohou odlišovat svou délkou, ale co mají společné, je jejich harmonický průběh. Ten je vyznačen pomocí chroma vektorů. Synchronizační proces vychází z principu jedna partitura a nekonečné množství zvukových realizací. Pokud mají referenční a cílové nahrávky shodný harmonický průběh (vycházejí ze shodné partitury), můžeme převést ručně anotované takty referenčního záznamu do všech ostatních interpretací.

Nabízí se ještě další možnost. Máme-li k dispozici notový zápis ve strojové podobě (např. MIDI, XML nebo MusicXML soubor z notačního softwaru), můžeme extrahovat pozice taktů a aplikovat tzv. score-to-audio synchronizaci. Tím lze obejít nutnost manuálních anotací. V rámci komparativní hudební analýzy jsou ovšem manuální anotace běžné. Nespornou výhodou je časová efektivita. Vytvořit strojový notový zápis je prozatím daleko náročnější, než běžné manuální vyznačení pozic taktů.

Je software už hotový? Můžete mi prosím vysvětlit, jak funguje a co umí?

Ano, náš software je dokončen a do této doby posloužil jako metodologický základ několika studií. Se softwarem se mohou zájemci seznámit na stránkách našeho projektu Paměť zvuku. Mnohé z jeho funkcí jsme prozatím nevyužili, přesto se pokusím některé z možností ve stručnosti popsat. V programu MemoVision můžeme přehrávat a vizualizovat jednu či více nahrávek, nebo jejich části. Program také nabízí porovnání parametrů libovolného počtu interpretací podle binárních relací (binárních štítků), např. relace domácí–zahraniční (interpret), žena–muž, datace před či po vymezeném roce atd. Lze tak rychle a jednoduše zjistit, zda existují mísa, které jsou mezi dvěma skupinami v tempu či dynamice odlišná. Na tyto sekce se pak můžeme zaměřit a definovat důvody, které rozdíly způsobily.

Různé druhy grafických ztvárnění posuzovaných interpretací nám lépe pomáhají těmto rozdílům porozumět. V jedné z přípravných studií projektu byl na základě strojového učení vytvořen klasifikátor, jenž dokáže odlišit nahrávky českých interpretů od zahraničních u vybraných smyčcových kvartetů s pravděpodobností převyšující 90 %. To můžeme například využít při definování anonymních nahrávek. Program může posloužit v situacích, kdy musíme vyslovit kvalifikovaný odhad původu nahrávky, roku jejího pořízení, národnosti a pohlaví interpreta.

V jiné studii jsme například poukázali na snahu po zrychlování interpretace některých vět Dvořákových symfonií, která je dobře slyšitelná především u amerických orchestrů. Něco takového se ovšem neprojevuje v Dvořákových kvartetních skladbách. České soubory jdou navíc cestou opačnou a „klasicky“ pojímaného Dvořáka na řadě míst zpomalují. Zatímco u Dvořáka je snaha hrát mnohdy pomaleji, strhává členitá forma Janáčkových dvou smyčcových kvartetů a odlišný charakter díla k živější interpretaci. I když se v Janáčkově případě obě skupiny (domácízahraniční) statisticky přibližují, prozrazují jednotlivé interpretace snahu po odlišném pojetí. Zde je potřeba dodat, že jsme pracovali s nahrávkami vzniklými od počátku padesátých let minulého století až po současnost.

Rád bych také připomenul případ britské pianistky Joyce Hatto (1928­–2006). Ta se proslavila tím, že pod jejím jménem byly vydány neautorizované a patřičně upravené zvukové nahrávky jiných pianistů. Aniž by sama veřejně vystupovala, vysloužila si významná ocenění od kritiků a odborné veřejnosti. Byla považována za mimořádnou uměleckou osobnost, která tvoří v klidu nahrávacích studií a vyhýbá se všem formách veřejného uznání. Podvod vyšel najevo teprve několik měsíců po její smrti. K potvrzení některých závěrů významně přispěl program SonicVisualiser připravený našimi britskými kolegy.

Foto: archiv L. Spurného
Pro koho je takový software vhodný?

Program je určen širokému spektru odborné i laické veřejnosti. Do tohoto výčtu můžeme zahrnout hudební interprety, muzikology a hudební teoretiky, hudební pedagogy, audioinženýry, pracovníky paměťových institucí. Uživateli softwaru mohou být pochopitelně běžní zájemci o hudbu, kteří chtějí lépe poznat své oblíbené skladby.

Existují i jiné softwary sloužící k automatické analýze interpretačního hudebního výkonu? Kde jste se inspirovali?

Prvním z podnětů pro nás byly výzkumy domácích i zahraničních muzikologů, samozřejmě bez pomoci počítače. Za průkopníky analýzy interpretačního výkonu prostřednictvím kvantitativní analýzy v bývalém Československu lze považovat Milana Kunu a Miloše Bláhu. Výsledky jejich spolupráce nalezneme v několika studiích ze 70. a 80. let minulého století. Časová data získávali autoři ručně prostřednictvím stopek. V nedávné historii analogových zvukových záznamů šlo o běžný a prakticky jediný způsob měření. Taková činnost byla pracná a byla navíc zatížena předpokládanou chybou vycházející z reakce osoby, která měření prováděla. Přes tyto výhrady byly postupy a výsledky práce velmi zajímavé a přinejmenším srovnatelné s děním v jiných zemích. Alespoň v prvních letech, kdy byl popisně statistický přístup aktivně uplatňován, se tak dělo bez složitějšího technického zázemí, pouze s použitím studiových magnetofonů. Široké možnosti této metody přesvědčivě dokázal José Antonio Bowen ve studii Tempo, Duration and Flexibility: Techniques in the analysis of performance z roku 1996.

Nová tradice oboru je zřetelně definována ve výstupech týmu autorů, soustředěných okolo Centre for the History and Analysis of Recorded Music (CHARM). Toto výzkumné centrum mělo ve svém portfoliu celou řadu aktivit. Centrum díky grantové podpoře fungovalo do roku 2004. Od roku 2009 pak s novým výzkumným programem a pod změněným názvem „The AHRC Research Centre for Musical Performance as Creative Practice“. V tomto projektu byl výzkumníky z CHARM uplatněn program SonicVisualiser, jenž znamenal zásadní posun v počítačem podporované analýze hudebně-interpretačního výkonu, především kvůli způsobu vytváření ručních anotací.

Dalším výstupem je specializovaná databáze nahrávek. Můžete mi prosím říct, jak probíhal sběr nahrávek?

Úkol připravit databázi nahrávek připadl kolegům z Českého muzea hudby (Národního muzeum v Praze). Pro potřeby projektu Paměť zvuku byly vytvořeny dvě databáze, nejprve přípravná testovací, poté databáze základní. Na vzorku Chopinových Nokturn (215 nahrávek) byly rozvíjeny základní postupy práce s digitálními záznamy, byla navržena metadatová struktura databáze, zároveň mohly být nastaveny a trénovány základní funkce vyvíjeného softwaru.

Druhá, plnohodnotná databáze, obsahuje klavírní skladby Bedřicha Smetany a Antonína Dvořáka. V úvodních krocích se spolupracovníci z Národního muzea (Českého muzea hudby) soustředili na rešerše nahrávek a jejich sběr: zvukové nosiče a jejich digitalizovaná forma se nacházejí především ve sbírkových fondech Národního muzea a v digitálním archivu firmy Supraphon, a.s. Jako finální výzkumný vzorek byly vybrány dva rozsáhlejší klavírní cykly obou skladatelů: Smetanovy České tance I a II, op. 21 (1877, 1879) a Dvořákovy Poetické nálady op. 85, B161 (1889).

Při samotné akvizici a zařazování nahrávek do databáze byly kromě zvukových záznamů zmiňovaných institucí zahrnuty také zvukové snímky zakoupené na původních nosičích, získané ze soukromých archivů sběratelů (Gabriel Gössel či Matthew Rose), nebo také volně dostupné nahrávky na webových či streamovacích platformách (zejména záznamy z živých vystoupení, soutěží a absolventských koncertů). Vedle muzejních evidenčních pomůcek posloužily jako doplňující informační zdroj vybrané zahraniční databáze a repozitáře, především Discography of American Historical Recordings, Library of Historical Audio Recordings (i78s), The Great 78 Project prezentující své výsledky v rámci platformy Internet Archive či Naxos Music Library.

Spíše neplánovaně, jako materiál pro případovou studii věnovanou vznikajícímu softwaru, vznikl obsáhlý dataset nahrávek z kvartetní tvorby českých skladatelů. Její součástí jsou záznamy skladeb Bedřicha Smetany, Antonína Dvořáka a Leoše Janáčka v celkovém počtu 1315 nahrávek.

„Uživateli softwaru mohou být pochopitelně běžní zájemci o hudbu, kteří chtějí lépe poznat své oblíbené skladby.“

Lubomír Spurný, řešitel projektu
Je databáze volně dostupná?

Databáze nahrávek je součástí programu Vision, který bude brzy volně přístupný. Uživatelská část je založena na webovém prostředí a jazyce JavaScript, díky tomu není nutné software instalovat lokálně, ale lze k němu přistupovat přes webovou stránku na internetu. Odkaz na webovou stránku softwaru bude dostupný přes oficiální stránky projektu.

Proč jste vybrali nahrávky právě Bedřicha Smetany a Antonína Dvořáka?

Software vznikal poměrně dlouho a při jeho přípravě, alespoň na začátku, jsme neměli žádnou konkrétní představu o zvukovém materiálu, na kterém bychom jej mohli uplatnit. S grantovou výzvou TAČR jsme ovšem tento repertoár najít museli a blížící se Rok české hudby nám byl jasným vodítkem. Zaměřili jsme se tedy na klasiky české hudby a na skladby, které nám umožnily uvažovat o tzv. autentické interpretaci domácími hudebníky. Nejprve jsme vybrali klavírní skladby, protože jejich zpracování je daleko jednodušší než například u skladeb orchestrálních.

Zatímco klavírní skladby těchto autorů si vedle Chopina či Schumanna hledají jen složitě své uplatnění, patří smyčcové kvartety Bedřicha Smetany, Antonína Dvořáka a Leoše Janáčka ke kmenovému repertoáru světových souborů. Nepřekvapí proto, že tato díla tvoří nejrozsáhlejší databázi zvukových nahrávek, kterou jsme využili při analýze a zpracování. Rovněž z pohledu dějin interpretační praxe domácí hudby se jedná o nezanedbatelnou oblast. Česká kvartetní škola má svou historii a reprezentativní řada zvukových záznamů je toho dokladem. Je jednou z mála domácích uměleckých činností, u které lze sledovat kontinuální vývoj a výraznou interpretační tradici od poslední třetiny 19. století po současnost.

Foto: archiv L. Spurného

prof. PhDr. Lubomír Spurný, Ph.D.

zástupce vedoucího ústavu – Ústav hudební vědy

Vědecko-pedagogický pracovník a zástupce vedoucího Ústavu hudební vědy Filozofické fakulty Masarykovy univerzity v Brně. V rámci své odborné profilace se věnuje zejména hudební teorii a estetice první třetiny 20. století, hudebním fenoménům středoevropské kultury 19. a 20. století, teorii provozovací praxe a teorii interpretace, metodologii hudební analýzy, vybraným autorům a konceptům středoevropské meziválečné avantgardy, a hudební tvorbě vznikající za druhé světové války, zejm. v podmínkách koncentračních táborů.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.