Centrum informačních technologií FF

Cesta knihy do digitální knihovny: digitalizace v humanitních vědách

Vzácné rukopisy, básnické sbírky nebo staré tisky. Kulturní dědictví, které bychom rádi předávali z generace na generaci a uchránili jej před ztrátou, krádeží či úplným poničením. I s tímto nám mohou pomoct digitální technologie. Díky digitalizaci se příběhy a myšlenky zachycené v knihách a rukopisech stávají dostupnými pro širokou veřejnost, vědecký výzkum i budoucí generace.

14. 10. 2024 Kateřina Hendrychová

Předtím než se rozhodneme data získávat, je užitečné, především u výzkumných projektů, vytvořit si plán řízení dat neboli Data Management Plan (DMP), který může být užitečnou pomůckou pro správu a řízení výzkumných dat. Dokument popisuje, jaká data se budou získávat, jakým způsobem se budou během výzkumu využívat, kde budou uložena, jak budou strukturována a popsána metadaty. Měl by také poskytovat informace o tom, jak budou výzkumná data využívána po skončení projektu a zda, případně komu, budou přístupná. Otevřený přístup k datům je v posledních letech stále více podporován, ať už vědeckými institucemi či poskytovateli finančních prostředků. Možná jste se už setkali s tím, že by výzkumná data měla naplňovat FAIR principytedy, že by měla být dohledatelná (Findable), dostupná (Accessible), interoperabilní (Interoperable) a opětovně využitelná (Reusable).

Digitalizace jako klíč k uchování kulturního dědictví

Digitalizace je proces, při kterém se fyzické dokumenty nebo objekty převádí do digitální podoby. V humanitních vědách to zahrnuje převod knih, rukopisů, archivních dokumentů, fotografií, zvukových záznamů či artefaktů do formátu, který lze snadno zpracovávat počítačem. Digitální data jsou symbolické reprezentace empirických tvrzení o reálném světě uložené v digitálním formátu, které lze dále analyzovat, sdílet a dlouhodobě uchovávat. Výhodou digitálních dat na rozdíl od těch analogových je právě jejich snadná dostupnost a možnost je analyzovat pomocí různých softwarových nástrojů bez toho, aniž by docházelo k poškození a snižování kvality předlohy.

Proces digitalizace obsahuje několik kroků, které mohou různě variovat a které v posledku vytvoří požadovaný výsledek. Digitalizace přináší řadu výhod. Jednou z nich je určitě ochrana kulturního dědictví – například starých rukopisů, historických map či periodik, které jsou často velmi náchylné k poškození. Právě u fyzických exemplářů dochází k rychlé degradaci vlivem např. častého listování. Kromě toho tyto často velmi vzácné artefakty digitalizací chráníme před ztrátou či krádeží. Dalším přínosem digitalizace je také zpřístupnění velkého množství např. literárních textů veřejnosti. Třeba v České elektronické knihovně najdete 1700 básnických knih česky psané poezie 19. a počátku 20. století. Jedná se tak o nejrozsáhlejší fulltextovou databází svého typu na českém internetu, kterou ocení studující i vyučující nejen na vysokých školách. Digitální platformy svým uživatelům nabízejí volný přístup k velkému množství informací prakticky odkudkoliv, z pohodlí domova si tak můžete vybrat jednu z 764 monografií Digitální knihovny Filozofické fakulty, prohlédnout si rozsáhlé dílo prof. Arna Nováka v Digitální knihovně Arna Nováka nebo nahlédnout do databáze Herbaria manuscripta, která obsahuje soupis středověkých rukopisných herbářů dochovaných v České republice. V této databázi najdete informace o více než sto dvaceti rukopisech. Digitální knihovny dnes už často umožňují fulltextové vyhledávání – při digitalizaci se často provádí ocerizace neboli optické rozpoznání znaků (Optical Character Recognition). Tato technologie pomocí scanneru umožňuje počítačům rozpoznávat text z obrázků nebo skenů do strojově kódovaného textu. 

Digitalizace tištených a obrazových materiálů jako jsou knihy, obrazy a rukopisy jsou dnes už běžnou praxí. Digitalizovat však můžeme také fyzické objekty nebo zvukové nahrávky. V obrazové databázi Vzory krásy najdete vzory historických tkanin ze 17. až 19. století, ke kterým byste se jinak pravděpodobně nedostali. Možná to někoho překvapí, ale v digitální knihovně Moravské zemské knihovny zase kromě literatury najdete také zvukové nahrávky. Svoje zastoupení tam má vážná hudba Johana Sebastiana Bacha nebo Bedřicha Smetany, najdete tam ale také mnoho žánrů populární či lidové hudby. Právě dostupnost je jednou z velkých výhod digitálních databází, archivů či repozitářů. V neposlední řadě digitalizace napomáhá dalšímu výzkumu a mezinárodní vědecké spolupráci.

Databáze Vzory krásy, která zpřístupňuje vzory historických tkanin ze 16. až 19. století.

Z poličky do digitální knihovny

Digitalizace se využívá v různých oblastech či oborech, konkrétní fáze jsou tedy vždy přizpůsobené aktuálním podmínkám a požadavkům. Obecně však proces digitalizace obsahuje několik kroků. V první fází si většinou vytvoříme plán digitalizace a analyzujeme, jaké objekty (či dokumenty) chceme digitalizovat a proč. Literární dokumenty se zpravidla digitalizují za účelem ochrany fondu. Kvůli autorskému zákonu však nelze zveřejnit vše – o tom, co se zveřejní rozhoduje kurátor. Digitalizovat můžeme také z důvodu poptávky po určitém typu dokumentu (třeba dílo konkrétního autora). Pokud zůstaneme u digitalizace literárních dokumentů, tak v přípravné fázi si také určíme, zda chceme digitalizovat např. periodika, mapy, rukopisy nebo skripta. Každý typ dokumentu má totiž svá specifika. Dále je užitečné si stanovit, kolik dokumentů se bude digitalizovat a kolik celý proces zabere času. Vybranou knihu či dokument je poté potřeba načíst do Registru digitalizace, ve kterém mj. zjistíte, zda už knihu nenaskenoval někdo před vámi. V dalším kroku už probíhá digitalizace vybraných dat, a protože literární texty se skenují, je potřeba vybrat vhodný skener. Po naskenování přichází na řadu kontrola a úprava skenů.

Důležitým krokem je také zajištění místa, kde budou digitální data bezpečně uložena – servery, platformy a databáze. S tím souvisí také zpřístupnění dat veřejnosti a vytvoření metadat, štítků nebo kategorií, které budou uživatelům umožňovat efektivní vyhledávání. Toto je samozřejmě velmi zjednodušený nákres celého procesu, který je velmi komplexní a personálně, finančně i časově poměrně náročný. Jak probíhá digitalizace knih např. v Moravské zemské knihovně se můžete podívat tady.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.