Jak citovat data

Citování použitých publikací je pro každého studenta i výzkumníka samozřejmostí. Stejně podstatné je také správné označení použitých dat, ať už vytvořených samotným autorem, nebo přejatých. Správně formulované citace datových sad napomáhají šíření vědeckého poznání a ověřitelnosti výsledků.

16. 6. 2020 Pavla Martinková

Uznání důležitosti citování dat je jedním z osmi principů, které jsou hlavní součástí Joint Declaration of Data Citation Principles. Jejich formulace je výsledkem společné snahy více než 25 organizací a finalizovány byly v roce 2014.

1. Důležitost

  • Data by měla být považována za legitimní výzkumné výstupy hodné citování. Citacím dat by měla být přisuzována stejná důležitost jako je tomu u jiných výsledků výzkumu, například publikací.

2. Ocenění a autorství

  • Citace dat by měly napomoci akademickému ohodnocení a normativnímu a zákonnému uznání podílu všech autorů, se zohledněním toho, že jednotný styl nebo mechanismus přisuzování nemusí být použitelný pro všechny typy dat

3. Důkaz

  • Každé tvrzení v odborné literatuře učiněné na základě dat by mělo uvádět citaci těchto dat.

4. Jednoznačná identifikace

  • Citační záznam dat by měl zahrnovat metodu persistentní identifikace, která je strojově využitelná, globálně jedinečná a široce využívaná danou komunitou.

5. Přístupnost

  • Citační záznamy dat by měly usnadnit přístup k samotným datům a souvisejícím metadatům, dokumentaci, kódu a dalším materiálům, které jsou nezbytné pro poučené využití odkazovaných dat, a to lidmi i stroji.

6. Udržitelnost

  • Jedinečné identifikátory a metadata popisující data a jejich vlastnosti by měly být zachovány – dokonce mohou přesáhnout životnost popisovaných dat.

7. Konkrétnost a ověřitelnost

  • Citační záznamy dat by měly umožnit identifikaci, přístup a ověření konkrétních dat, která byla využita pro podporu tvrzení. Citační záznamy nebo bibliografická metadata by měla obsahovat informace o provenienci a neporušenosti dat, aby umožnila ověřit, zda se později získaná podoba, verze a/nebo část dat shoduje s daty, která byla původně citována.

8. Interoperabilita a flexibilita

  • Metody citování dat by měly být dostatečně flexibilní, aby vyhovovala praktikám různým komunit, aniž by se lišily natolik, že ohrozí interoperabilitu citačních praktik napříč komunitami.

Jak má citace dat vypadat

Datové repozitáře mohou generovat bibliografické citace automaticky nebo nabízet export do vybraného formátu. Přesto je dobré se s jednotlivými prvky citace seznámit. Stejně jako u citování publikací by hlavním cílem mělo být umožnit komukoliv jednoznačnou a co nejsnazší identifikaci a nalezení použitého zdroje. Proto je vždy lepší uvést co nejvíce údajů, pokud je máme k dispozici.

Prvky citace

Jejich pořadí závisí na použitém citačním stylu. Prvních pět zvýrazněných prvků by podle doporučení DCC mělo být vždy uvedeno.

  • autor
  • datum vydání
  • název datasetu: Dobrý název popisuje obsah datasetu, například z jakého období nebo oblasti data pochází.
  • vydavatel: distributor dat; Obvykle název repozitáře, ve kterém jsou data uložena.
  • umístění: trvalé URL a/nebo persistentní identifikátor (například DOI nebo Handle); Pokud je k dispozici více URL adres, měla by být použita ta, která směřuje na informace o datech (ne přímo na stažení datasetu) a na příslušnou verzi.
  • edice
  • verze: Verze je u datových sad velmi důležitá. Povinností repozitářů je uchovávat informace o veškerých změnách a umožnit výzkumníkům jednoznačně odkazovat na jednotlivé verze (například může mít každá z nich jiné DOI).
  • feature name a URI
  • typ zdroje: dataset
  • kryptografický hash (UNF)

Nevydaná data lze citovat alespoň autorem, názvem a datem sběru s poznámkou a pozdějším doplněním.

Citace podle ČSN ISO 690

Rozšířená norma ČSN ISO 690, podle které cituje většina studentských prací na fakultě, se k datovým sadám explicitně nevyjadřuje. Lze se domnívat, že spadají do kategorie elektronických dokumentů. Při dodržení zásad Force 11 by záznam mohl vypadat takto.

Podoba citace podle ČSN ISO 690

  • Jméno tvůrce. Název [dataset]. Verze. Nakladatel, Datum publikování, Datum aktualizace [Datum citování]. Standardní identifikátor. Dostupnost a přístup. Poznámka.

Nakladatelem je repozitář, ve kterém jsou data uložena. V případě nepublikovaných dat je možné použít popisný název v hranatých závorkách a uvést zdroj, pokud je známý. Údaje se uvádí v jazyce citovaného dokumentu, v uvedeném příkladu v jazyce rozhraní repozitáře Zenodo.

Příklad citace podle ČSN ISO 690

  • BALL, Warrick H. A synthetic sample of short-cadence solar-like oscillators for TESS [dataset]. Version 1. Zenodo, October 24, 2018 [cit. 2020-05-13]. DOI: 10.5281/zenodo.1470155. Dostupné z: https://zenodo.org/record/1470155

Citace podle APA Style Manual

Aktuální sedmá verze manuálu Americké psychologické asociace se věnuje přímo citování datových sad. Zmiňuje dva případy, kdy k tomu má dojít: (1) v případě analýzy veřejně dostupných dat, (2) v případě první citace autorem vytvořených dat. Stručné shrnutí včetně příkladů je dostupné online, podrobnější informace najdete v publikaci APA Style Manual.

Podoba citace podle APA

  • Jméno tvůrce. (Rok vydání). Název datasetu (kód datasetu; verze) [Data set / Data set and code book / etc.]. Vydavatel. URL.

Vydavatelem je repozitář, ve kterém jsou data uložena. V případě nepublikovaných dat je možné použít popisný název v hranatých závorkách a uvést zdroj, pokud je známý.

Příklad citace podle APA

Použité zdroje


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info