Popis ****************************************************************************************** * ****************************************************************************************** Cíl: Cílem této metodiky je doporučení vhodných formátů archivních kopií dokumentů (Master pro výstupy z digitalizace z knihovnách UK. Respektování vybraných formátů a metadat usnad produkovaných digitalizátů a dlouhodobou ochranu na celouniverzitní úrovni . *========================================================================================= * 1. Metadata (MD) *========================================================================================= Rozlišujeme tyto základní typy metadat: • Popisná (někdy též nazývána bibliografická) • U popisných metadat platí "čím více, tím lépe". Pro popis jakýchkoliv typů digitalizov je žádoucí využívat standardní popisná MD. Na UK jsou nejčastěji využívány MARC21 [ UR www.loc.gov/marc/bibliographic/"] , Dublin Core [ URL "http://dublincore.org/"] a MODS www.loc.gov/standards/mods/"] . Jediným "povinným" prvkem je v popisných metadatech je Může jít např. o systémové číslo z CKIS [ URL "https://ckis.cuni.cz/"] (Centrální kata Karlovy). • Strukturální • Definují vnitřní organizaci či strukturu digitálního objektu. V případě zpřístupnění j správné zobrazení a navigaci digitálního objektu. Své významné postavení mají i v obla ochrany/archivace. Pro strukturální metadata je žádoucí využít dílčí část ( standardu METS [ URL "http://www.loc.gov/standards/mets/"] . • Administrativní • Slouží především ke správě a řízení digitálních objektů. Poskytují časové informace o úpravách digitálního objektu, specifikují okolnosti digitalizace. Často do této katego ochranná a technická metadata. • Ochranná (nebo též archivační) • Podporují a dokumentují proces dlouhodobé ochrany. Někdy jsou považovány za podsložku a administrativních MD. Zahrnují například informace o dokumentech a způsobu jejich vy které byly na souborech provedeny, odkazuje na provenienci; udržuje seznam zodpovědnýc dlouhodobou ochranu apod. Za minimum v tomto ohledu lze považovat informaci o provenie jakým nástrojem výsledné digitalizáty) vytvořil. • Technická [ URL "DKU-37.html "] • Technická metadata reprezentují technické charakteristiky počítačových souborů výstupů (např. údaj o datovém formátu zdroje, velikosti souboru, kontrolním součtu aj.). Měla XML schéma NISO Metadata for Images in XML [ URL "http://www.loc.gov/standards/mix//"] Toto schéma nabízí formát pro výměnu a/nebo uchování dat specifikovaných v Data Dictio Metadata for Digital Still Images (ANSI/NISO Z39.87-2006). *========================================================================================= * 2. Dlouhodobá ochrana - formáty *========================================================================================= Kritéria: rozšířenost, podpora, ochranné mechanismy (DRM apod.), zveřejnění, kvalita dokum stabilita, snadná identifikace a validace, práva duševního vlastnictví, podpora metadat, k interoperabilita, životaschopnost, vícenásobná použitelnost (re-usability). Je žádoucí volit formáty bez komprese. Vodotisky pro archivní kopie řešit pomocí autentiza vzorku (tzv. skrytý vodotisk), nikoliv pomocí viditelného vodotisku. ------------------------------------------------------------------------------------------ 1. Preferované formáty ------------------------------------------------------------------------------------------ Název Přípona MIME Type PUID Tagged Image File Format (TIF.tiff image/tiff .tif image/tiff-fx JPEG 2000 part 1 .jp2 image/jp2 x-fmt/392 (JP2) ------------------------------------------------------------------------------------------ 2. Akceptovatelné formáty ------------------------------------------------------------------------------------------ Název Přípona MIME Type PUID JPEG 2000 part 2 .jpx image/jpx fmt/151 (JPX) .jpf Portable Network Graphics .png image/png fmt/13 (PNG) (verze 1.2) Graphics Interchange Format .gif image/gif (GIF) fmt/4 (verze 89a) *========================================================================================= * 3. Technická specifikace digitalizace *========================================================================================= • kontrolní součty - pro kontrolu neporušenosti vytvářených souborů je nutné generovat ale tří nejčastěji využívaných kontrolních součtů - MD5, SHA nebo CRC) • názvová konvence souborů - pro potřeby případného univerzitního LTP systému je vhodné do názvosloví výsledných souborů digitalizačních výstupů. V názvech souborů se nedoporučuje diakritiku, mezery a symboly • Návrh názvu souboru: identifikátor_fakulta/soucast_zkraceny-nazev_dalsi-volitelne-popi Identifikátor může být např. SYSNO z Alephu nebo jiný jednoznačný identifikátor, který (např.123456789_ETF_Evangelia_skrin12_police7.tif) • evidence průběhu digitalizace plánovaných a již digitalizovaných dokumentů, včetně přidě identifikátoru/názvu souboru, který identifikátor obsahuje (např. pomocí některého z tab procesorů) • strukturování a seskupování logických celků - pomocí METS nebo např. při vkládání dat do formou CSV • namátková kontrola naskenovaných výstupů, aby bylo možné včas doladit případné nedostatk • DPI/PPI - minimální počet pixelů na palec pro archivní dokumenty (Master Copy) je 300 dp předloh většího formátu a kde to umožňuje velikost zálohovacích zařízení, je možné pro o dokumenty využít i vyšší DPI/PPI. *========================================================================================= * 4. Zpřístupnění pro obraz *========================================================================================= Podrobnější popis repozitářů UK pro všechny typu dokumentů lze najít na tomto webu, v sekc [ URL "DKU-49.html "] . ------------------------------------------------------------------------------------------ ------------------------------------------------------------------------------------------ Název URL http://digitool.is.cuni.cz Podro Digitální univerzitní repozitář DigiTool Ústře aliasy: kniho http://repozitar.cuni.cz digit http://repositar.cuni.cz http://repository.cuni.cz Kramerius FSV http://kramerius.fsv.cuni.cz Podro (plné texty pouze v budově knihkniho kniho krame *========================================================================================= * 5. Návrh workflow (fáze 1-7) *========================================================================================= Fáze 1. výběr a příprava dokumentů Výběr dokumentů k digitalizaci, kontrola záz Konzultace s Ústřední knihovnou, volba repoz 2. příprava digitalizace Ustanovení odpovědných osob, evidence průběh 3. pilotní provoz a testování Pilotní testování workflow, a to včetně pilo Zhodnocení kvality zpřístupnění. 4. proces digitalizace Proces skenování (respektování vnitřní metod copy) a uživatelské kopie (User copy), průbě 5. úprava digitalizačních výstupů Postprodukce - kontrola kvality, ořezy, sest apod.). 6. uložení, dlouhodobá ochrana Zápis na vhodná úložiště, zabezpečení min. 2 7. zpřístupnění Zpřístupnění uživatelských kopií do vybranéh *========================================================================================= * 6. Terminologie *========================================================================================= Vysvětlení některých výše uvedených termínů a akronymu lze najít v abecedně řazeném seznam "DKU-57.html "] . Předmětem tohoto doporučení nejsou uživatelské kopie (User Copy), které jsou generovány z digitalizátů. METS představuje standard pro kódování popisných, administrativních a strukturálních metad vyjádřený pomocí jazyka XML. https://www.nationalarchives.gov.uk/documents/selecting-file-formats.pdf https://www.kb.nl/sites/default/files/docs/KB_file_format_evaluation_method_27022008.pdf