Elektronické publikace

v

 Národní knihovně České republiky

Adolf Knoll



  1. Digitální svět

Žijeme v digitálním světě, a to stále víc a víc. Tato slova se mi již po několik let honí hlavou a současně s tím i související problémy tak, jak by asi měly být pojímány Národní knihovnou ČR. Samozřejmě velmi důležité místo má v těchto úvahách i Internet, který považuji za komunikační kanál a jev, který bude stále více ovlivňovat naše počínání v oblasti elektronických informací. Aby to nebylo tak jednoduché, je třeba podotknout, že z celého spektra digitálních informací si NK ukrojí jen kousek, a to nejen proto, že jí tento kousek již nyní přísluší, ale také proto, že dosud fungující analogie mezi klasicky šířenými informacemi a informacemi digitálními nemusí být pravdivá. A pokud přece jenom je, pak to možná znamená pro klasicky šířené informace i něco méně očekávaného, než jsme byli zvyklí.

  1. Informace a publikace

Obecně lze říci, že zásadní roli v procesu zprostředkování a ochrany informací hrají archivy a knihovny. Důležitý rozdíl mezi nimi tvoří charakter informací, které jsou ve středu jejich zájmu. Pokud bylo pro šíření informací užito veřejného komunikačního kanálu, pak lze říci, že informace byly zveřejněny neboli publikovány. Tvar, ve kterém se tyto informace nacházejí, lze pak nazvat publikací. Naproti tomu existuje celá řada informací, které pro veřejné šíření určeny nejsou (korespondence, interní materiály organizací, soukromé elektronické dokumenty atp.); přesto však jejich uchování může být celospolečensky velmi důležité. Zde je důležité si též uvědomit, že elektronický text určený pro počítačovou sazbu knihy není publikací a není tudíž i předmětem zájmu například národní knihovny; může se jím však stát, pokud dojde k dohodě jej elektronicky veřejně zpřístupňovat.

Knihovny pracují především se zveřejněnými informacemi, publikacemi, kdežto archivy se zajímají o oba typy informací za účelem dokumentace určitých skutečností. Z pohledu NK pak vzniká povinnost některé publikace uchovávat a dlouhodobě zpřístupňovat. V různých zemích je pokrytí této oblasti národními knihovnami různé; pokud jde o elektronické publikace, pak většinou jen částečné.

Je třeba si uvědomit, že tak jako kniha a časopis, je z tohoto pohledu publikací i rozhlasový nebo televizní pořad, zvuková nahrávka, počítačová hra, film nebo videonahrávka, statický nebo dynamický elektronický dokument zprostředkovaný po Internetu. Zákony o povinném výtisku v jednotlivých zemích také různě tuto oblast pojímají. V této souvislosti je třeba si znovu uvědomit a zopakovat, že povinný výtisk existuje za účelem archivace dokumentového bohatství. Některé návrhy novel těchto zákonů (například dánský) skutečně zahrnují rozhlasové a televizní vysílání, v řadě zemí je však tato oblast pokryta speciální legislativou a činností speciálně zaměřených archivních institucí.

Ne vždy existuje jasná hranice mezi informací a publikovanou informací, zvláště pak v úvahách knihoven o rozšíření jejich činnosti na oblast elektronických publikací. Celkem jasně bylo toto rozlišení pak pojmenováno v jednom z návrhů speciální zprávy americké Commission on Preservation and Access o elektronických informacích.

  1. Ošidná analogie

Každá národní knihovna, jež se hodlá nějakým způsobem zabývat elektronickými publikacemi a jež již nyní má archivní funkci týkající se klasických publikací, musí dobře zvážit všechny aspekty zaznamenávání a sdělování informací formou dokumentů. Zejména pak musí vše vztáhnout k trvanlivosti informací v čase.

Reakce většiny národních knihoven většinou, bohužel, kopírují již dříve započatý trend shromažďování dokumentů jako artefaktů. Pokud jde o dokumenty, jejichž informace jsou čitelné pouze pomocí lidských smyslů, shromažďování dokumentů vytváří současně i slušný informační potenciál, který je a bude v historicky představitelném období sdělitelný. Totéž vůbec nemusí platit o dokumentech, k jejichž recepci potřebujeme technická zařízení. V mnoha případech se totiž stane, že kromě artefaktů nebudou v archivech žádné nám dostupné informace, k jejichž sdělení byly dotyčné artefakty původně vytvořeny.

Zajímavější na všem tom je však skutečnost, že nejde o nějaký pronikavý rozpor mezi těmito dvěma kategoriemi dokumentů. Každý dokument je na tom v podstatě stejně, jen na něj rozdílně působí faktor času. Dokumenty staré civilizace, které již nejsme schopni přečíst nebo rozluštit, dopadly stejně jako strojem čitelný dokument, který již nejsme schopni technicky dekódovat.

Rád bych však poukázal přitom především na to, že staré nápisy nedokážeme přečíst ne proto, že na jejich zhotovení byly použity nestabilní materiály, ale protože nám chybí další kontext, další informace, které by je dokázaly osvětlit (například paralelní text v nám známém jazyce). Stejně je tomu tak i u moderních elektronických dokumentů, u kterých byla velmi dlouho označována za kritickou právě stabilita médií. Není to pravda. Kritickým faktorem je především naše schopnost vybavit moderní dokumenty tak, aby měly větší šanci přežít, zejména pokud jde o jejich srozumitelnost.

I k těm nejsložitějším datům, pokud je chceme uchovat dlouhodobě, bychom měli přidávat srozumitelným způsobem další data o těchto datech, kterým lze obecně říkat metadata.

Dále je třeba si dobře rozmyslet, zda budujeme muzea dokumentů jako artefaktů (knihovna jako určité muzeum knižní kultury je přijatelná, ale jako muzeum dalších médií ?) nebo archivy informací. Má-li například NK za povinnost archivovat českou produkci audionahrávek vydaných na kompaktních discích, jak se zachová? Bude se snažit archivovat konkrétní nahrávky nebo jejich publikace (jedna nahrávka může být vydána vícekrát)? A co udělá, až se změní technologie tak, že bude hrozit, že původní artefakt již bude nečitelný (neslyšitelný)?

Všichni pravděpodobně se shodnou na tom, že jde především o konkrétní nahrávku, která bude s největší pravděpodobností převedena na jiné médium, zatím co původní médium se stane postupně jen mlčícím předmětem. Uznávám, že muzeum mlčících předmětů má též něco do sebe, každopádně vypovídá o vydavatelské kultuře v té které oblasti.

Dojde tedy k záchraně informace a zároveň k vytvoření nového náhradního dokumentu. Proč? Budeme se chovat stejně v případě díla Franze Kafky nebo Johanna Wolfganga Goetha? Budeme zachraňovat text Shakespearových Sonetů nebo text Haškova Švejka, když nám náš artefakt, tj. vydání XY tohoto románu, začne razantně hlodat zub času? Nejspíše to nemá smysl, neboť tyto texty kolují v kvantech vydání po celém světě a jsou vydávány stále znovu. Někdo to dělá za nás. Asi to bude knižní trh. Takže při pohledu od moderních dokumentů zpět k těm klasickým vidíme, že pokud jde o ty informace, které byly stvořeny autorem přímo ke sdílení, chráníme spousty takových informací, které nejsou ohroženy, neboť poselství jejich tvůrců je díky zájmu veřejnosti předáváno stále dál. To bude asi platit obecně o nadčasových dílech, zatím co na druhé straně je obrovské množství informací velice významných pro naši a světovou kulturu, které toto štěstí nemají. Jde například o noviny a vzácné historické dokumenty. Trh tu nefunguje a nevytváří další podpůrné dimenze; to budou muset knihovny samy.

Vrátím-li se k  výrazu ošidná analogie, pak je třeba konstatovat, že vlastně nejdůležitějším a také nejtěžším činem knihoven musí být selekce pracující jak v přítomnosti, tak i jdoucí do minulosti a budoucnosti. Věřím, že takto řečeno se to nemusí líbit. Ale existuje vůbec alternativa? UNESCO publikovalo kritéria selekce k programu Paměť světa, jehož cílem je záchrana a uchování světového dokumentového dědictví, a to jak zděděného, tak i toho, které je nyní vytvářeno, takže je zřejmé, že selekci se nevyhneme, neboť uchovat vše ve srozumitelném tvaru nebude v našich silách - a pravděpodobně to také není důležité.

  1. Obrana digitálního světa

Digitální svět je křehký, protože je mladý, protože není ještě i přes velké množství dobrých standardů dostatečně unifikován, protože média a softwarové a hardwarové platformy se rychle vyvíjejí a mění. Na druhé straně je digitální záznam stabilní, neboť je tvořen nehmotnou sekvencí čísel, zatím co jakýkoli jiný záznam je chemicky a fyzikálně podmíněný, a tudíž měnící se v čase (různé záznamy různou rychlostí, jak vyplývá ze srovnání archivního mikrofilmu s novinami vytištěnými na běžném papíře).

Digitální záznam je schopen zastavit čas, eliminovat stárnutí záznamového materiálu a jeho interakci s vlastním nosičem informací. Otevírá tím nejen šanci se věnovat nosiči samému, ale především upozorňuje na nezbytnost vytvoření určitého virtuálního soběstačného záznamu, který by byl obecně srozumitelný a který by byl zdrojem jakýchkoli uživatelských interpretací.

  1. Metadata a jejich strukturace

Píšeme-li text na počítači v libovolném textovém editoru, hlavním naším kritériem je estetická funkce textu. Potřebujeme jej strukturovat tak, aby tím, že se líbí, byl co nejpříznivěji přijímán. K tomu, abychom toho dosáhli, ukládáme k textu určité další informace, které zařídí jeho příznivou realizaci, které jej formátují. Jsme vedeni především tím, jak má text vypadat, proto dodávání dalších neviditelných (meta)informací k textu (do textu) má formální formátovací charakter a říká se mu procedurální markup (procedural markup). Totéž se vlastně děje například při formátování bibliografického záznamu pro tisk národní bibliografie nebo za účelem zobrazení na monitoru počítače.

Analogie s formálním formátováním bibliografického záznamu nás pomůže převést dál. Všichni víme, že v tomto případě existuje ještě další vnitřnější formát, například UNIMARC nebo USMARC či MAB, ve kterém jsou částečky textů popisujících publikaci označeny dle jejich významu, uspořádány semanticky do kategorií jako hlavní název, údaje o odpovědnosti, místo vydání apod. Toto označování popisuje obsahový význam částí dokumentu a říká se mu popisný markup (descriptive markup).

Procedurální markup může být různě důmyslný, jen si porovnejme klasický dosovský editor T602 s poslední verzí MS WORD. Můžeme si všimnout, že to, co jsme v T602 nějakým způsobem zařizovali velmi primitivním způsobem v podstatě přímo z klávesnice počítače, to je v MS WORD regulováno již více vzhledem k významu formátovaných částí textu. Proto, abychom vytvořili zdání odstavce, můžeme vynechat v T602 řádek, kdežto v MS WORD si danou sekvenci textu vlastně označíme jako odstavec, který je pak zvoleným způsobem formátován; stejně tak je to s nadpisy, poznámkami, vysvětlivkami atp. Zřetelně se tu posouváme více do klasifikované vnitřní struktury textu. Podobně funguje například i základní webovská abeceda, jíž je jazyk HTML (Hypertext Markup Language). Dochází tak k určité unifikaci procedurálního markupu, což je velmi důležité i pro konverze do různých formátů. Také proto například konverze středně obtížného textu dopadne vždy lépe mezi MS WORD a Corel Word Perfectem, než je tomu ve vztahu ke klasickému editoru T602, kde se řada informací ztratí, neboť jejich kategorie neexistuje jako taková, a není tudíž náležitě označena.

Kromě tohoto markupu, který je zásadní pro dostupnost k řadě elektronických dokumentů a který by se měl začít chovat určitým jednotným způsobem, může existovat a existuje i možnost obdobným způsobem označovat i sémanticky definované části textu, jako jsou autor, rozpis obsahu dokumentu nebo určité další kategorie a aspekty dokumentu, jako mohou být kategorizovaný popis obrazového vybavení, hudební notace, různé kategorie obsažených a sledovaných témat dle zadání zpracovatele, tzn., že tak, jak je publikace abstrahována a strukturována do bibliografického záznamu, obdobně může být obsahově popsána i uvnitř sebe. Toto je možné realizovat na základě vytvoření a označení sledovaných kategorií vlastností dokumentu, jejich definice a následného označování (markupu) příslušných realizací těchto kategorií uvnitř dokumentu.

Tato koncepce vyhlíží srozumitelně a lze ji uskutečnit pomocí určité aplikace SGML. Jednotlivé obsahové kategorie z různých takto popsaných dokumentů lze pak dále počítačově zpracovávat, tj. indexovat, vytvářet rejstříky, tezaury, detailní informační systém atp.

Poměrně častou vlastností současných dokumentů je, že základní dokument nemusí obsahovat přímo v sobě všechna nezbytná data. Ta mohou být vzhledem k němu externí a pouze při zobrazení celého dokumentu mohou být přivolána. Tato data se mohou nacházet v externích souborech buď přímo ve stejném adresáři nebo v jiných adresářích a v Internetu v prostředí WWW i na různých serverech. Dokument tak vzniká dynamicky z různých zdrojů pouze pro příslušné zobrazení. Obdobné je to vlastně i při zobrazení výsledku rešerše v bibliografické databázi nebo OPAC, i když zde častěji jde o stejný zdroj, jenž je využit jen zčásti tak, jak je to požadováno rešeršním dotazem.

Z praxe známe tuto situaci z práce na Webu a víme, že dynamické vytváření dokumentu je velmi dobře zvládáno jazykem HTML. Specifickou podmnožinou této situace je pak skládání dokumentu nejen pouze z různých textů, ale též z obrazů, zvuku a videa, které jasněji ukazují, že nejsou stálou součástí základního dokumentu, přesněji řečeno jeho nosného skeletu.

Pro nás to pak znamená, že musíme mít schopnost nejen označovat (markup) data uvnitř základního dokumentu, ale též různé vlastnosti dat ležících vně tohoto dokumentu.

  1. Složený dokument

Termín složený dokument (compound document) označuje zvláště ty dokumenty, které jsou vytvářeny různými typy souborů; v podstatě však může jít i jen o textové soubory, kdy (a zase to známe z Webu) nás základní dokument v HTML navádí na dokument v RTF, PDF nebo MS WORD, který je vzhledem k němu externí.

Určitou nejasnost vnesla do této problematiky tzv. digitalizace, jíž se zejména v prvních obdobích rozuměl převod klasických předloh do počítačového grafického formátu. Vznikala tak velmi svůdná analogie především s převodem vzácných a ohrožených dokumentů na mikromédia. Sekvenční mikrofilmová kopie pak zejména tím, že byla kopií, sváděla k analogiím, které šly mimo textově závislé strukturující přístupy.

Jestliže totiž poznáváme originální knihu tím, že jí listujeme nebo že odvíjíme její kopii na mikrofilmu, pak ji zrovna tak dobře můžeme poznávat i tím, že "listujeme" soubor po souboru v adresáři, vytvořeném sumou digitálních obrazů reprezentujících strany originální knihy. Zrovna tak činíme i při poslechu digitální zvukové nahrávky na audio-CD. Mikrofilm sám musí dle příslušného standardu obsahovat určité údaje o originálu, na jehož základě byl pořízen. Tyto údaje pak mohou být využity spolu s technickými údaji o mikrofilmu samém při budování příslušného informačního systému, například EROMM (European Register of Microfilm Masters). Při čtení mikromédií je využíváno víceméně jednoduchých optických zařízení. Stejně tak lze i postupovat v případě množiny grafických souborů, představujících určitý originální dokument.

Jenže ... Počítače a stále se zdokonalující programové možnosti umožňují s grafickými soubory doslova kouzlit, a tak začaly vznikat různé přístupy  vedoucí ke komfortnějšímu a efektivnějšímu využití nasnímaných dat. Obecně lze říci, že společným jmenovatelem těchto přístupů bylo prohledávání popsaných grafických souborů způsobem obdobným v databázích. Odborníci mohli vybavit tyto grafické soubory popisným aparátem, takže digitalizovaný rukopis se počal tvářit jako databáze určitých záznamů o stranách rukopisu doprovázených jejich grafickým vyjádřením. A to v různých oblastech samozřejmě velmi svérázně, takže vlastně znovu začalo hrozit, že jediným společným jmenovatelem zůstane ono základní prohlížení grafických souborů na úrovni mechanismu prohlížení mikrofilmu avšak s komfortem příslušného prohlížeče, ať jím byly programy jako Corel Photo Paint, Adobe Phostoshop nebo sharewarové produkty Paint Shop Pro, Graphic Workshop, velmi rychlý a elegantní ACDSee a další.

Takže na jedné straně již dříve vznikly zejména textově orientované přístupy na bázi SGML, tj. různá DTD (Document Type Definition) nebo ucelené komplexní aplikace jako TEI (Text Encoding Initiative) a EAD (Electronic Archival Description) a na druhé straně u složených složitých a objemných dokumentů na CD přístupy velmi specifické a u datově lehčích dokumentů na WWW přístup na bázi HTML.

Vývoj se vlastně ubíral zcela přirozenou cestou, neboť u textových dokumentů je nejdůležitější text a případná grafika jej pouze doplňuje a ilustruje, zatím co u obrazových a zvukových dokumentů je předmětem zájmu obraz a zvuk. Jestliže SGML vznikl pro strukturaci textu a umožnění propojení s dalšími daty, pak postupně začíná vznikat u netextových dokumentů požadavek na propojení obrazových a zvukových dat na určitý doprovodný text, jehož objem je v porovnání s objemem obrazových a zvukových dat v podstatě zanedbatelný, jehož obsah však může začít hrát velmi klíčovou roli pro zpřístupnění těchto dat a pro další vědeckou práci s nimi.

Elegantně nám počal ukazovat vzájemné vazby textu a objemnějších vnějších dat Web a jazyk HTML. Pojednou započalo být představitelné budovat k obrazovým datům určitý domluvený datový skelet, který by obsahoval informace o obrazových datech a představoval i most k nim. V podstatě se začala ukazovat jako velmi využitelná stromová struktura a odkazovací schopnosti vlastní jazyku HTML s tím problémem, že HTML je vlastně charakterizován pouze procedurálním markup-em, kdežto k dobrému využití dat potřebujeme ještě mít možnost i semanticky laděného popisného markup-u, který ovšem není v HTML definován.

  1. Přece jen SGML anebo opatrněji ?

Je obecně známým faktem, že HTML vznikl na platformě SGML, neboť je definován v SGML příslušnou DTD a že je značně jednodušší: formátuje pouze formálně, je univerzálně přijat, provází nás každý den na Webu. Je-li cokoli strukturováno v HTML, je prohlížitelné v obecně dostupných prohlížečích jako Netscape nebo Microsoft Internet Explorer. Pokud jsou další data v povolených formátech pro grafiku (GIF nebo JPEG), zvládají je prohlížeče přímo, pokud jsou v dalších formátech pro cokoli, je nutný další speciální prohlížeč, který může fungovat v součinnosti s webovským (zvláštní kompresní formáty a textové formáty, další grafické formáty, zvukové a video). Vlastně všeobecná dostupnost k řídícím informacím je snadno zajištěna pro kohokoli; a současně kdokoli ji může i nesložitě zařídit.

Bude-li základní struktura na bázi jiné aplikace SGML, než je HTML, pak budeme potřebovat speciální SGML prohlížeče a pro Internet pravděpodobně - abychom zachovali snadný přístup - i generátor HTML z příslušné SGML aplikace, ať je to TEI, EAD nebo jiné konkrétní DTD.

Podobné úvahy jsme měli při navrhování struktury elektronických dokumentů, které budou vznikat pod záštitou programu Paměť světa UNESCO na základě ohrožených originálních dokumentů. HTML bylo pro nás velkým lákadlem, a proto jsme chtěli zůstat na jeho základě. Od jara 1996 vzniklo několik návrhů strukturování těchto dokumentů. Prozatím byl dodatečný semanticky zaměřený markup v HTML realizován prostřednictvím doplňkových tagů zapisovaných v rámci komentářů HTML. Tyto tagy (samozřejmě při běžném prohlížení neviditelné) dokázaly však vytvořit pružný systém tvorby metadatové struktury, využitelné mnohonásobně jak při budování informačního systému digitálního archivu, tak i při další práci s digitálními dokumenty. Desítky tisíc vysoce kvalitních obrazových souborů a desítky starých rukopisů strukturovaných dle starší verze 1.11 dokázaly praktickou životaschopnost obdobného přístupu.

Naše návrhy byly postupně projednávány v Subkomisi pro technologii tohoto programu UNESCO, která na základě pražského zasedání na jaře 1996 doporučila pro zpřístupnění výsledků digitalizační části programu užití jazyka HTML. V NK proběhlo na podzim 1996 pod záštitou UNESCO i školení expertů z několika dalších zemí na téma digitalizace historických rukopisů. Náš původní návrh struktury číslo 1.11 byl napsán pouze pro rukopisy a staré tisky, posléze na jaře 1997 byl zobecněn a dopracován jako verze 2.00. V současné době přece jen na základě londýnského jednání subkomise v květnu 1997 hledáme cestu lepší kompatibility se SGML.

Tagování uvnitř HTML komentářů velice prověřilo naše potřeby a napomohlo definování skutečně potřebných tagů; v současné době se pracuje na rozšířené DTD HTML, čímž dojde k završení kompatibility mezi naším přístupem, HTML a SGML.

Hned po dokončení této práce budou přizpůsobeny všechny další nástroje tomuto DTD a přistoupeno ke strukturování dokumentů vzniklých u nás digitalizací originálních předloh tímto způsobem. Půjde nejen o digitalizaci obrazu, ale též o digitalizaci ohrožených vzácných zvukových nahrávek.

  1. Souvislosti digitalizace v Národní knihovně ČR

Jak již bylo řečeno výše, považujeme Internet za jev, který nelze pouštět ze zřetele při našich programech zpřístupňování elektronických dokumentů. Máme velkou úlohu ve zpřístupnění dokumentového bohatství, které má poněkud mimotržní charakter, ať jsou to vzácné dokumenty historické nebo i ohrožené novější, z nichž největším problémem jsou noviny.

K tomu byl ve spolupráci s firmou Albertina icome Praha vyvinut v NK digitalizační program, který má řadu různorodých aspektů. Nebudu zde mluvit o našich začátcích na přelomu let 1992 a 1993 a našich pilotních projektech UNESCO. O nich se lze dozvědět z našich webovských stránek na základní adrese http://www.nkp.cz/externi/digit/digit.htm. Chtěl bych se však zmínit o současném stavu a našich výhledech.

  1. Problematika financování

Od roku 1992 se naše úsilí v oblasti digitalizace muselo spokojit se stále se ztenčující podporou rozpočtu Národní knihovny, menšími granty UNESCO, za které jsme museli odvést spoustu konkrétní práce, a podporou Nadace a později Společnosti Národní knihovny ČR a s tím související omezenou, ale velmi vítanou, podporou Nadace Preciosa z Jablonce nad Nisou a Komerční banky. Teprve od letošního roku se podařilo v rámci grantů v oblasti vědy a výzkumu obdržet grant na léta 1997-1998 pro oblast zpřístupnění a archivace vzácných fondů s využitím digitální technologie a grant na digitalizaci mikromédií. Nezbytnou součástí tohoto programu by bylo ještě zabezpečení digitalizace velkoplošných předloh, které vyžaduje speciální zařízení.

  1. Rozvoj digitalizace primárních dokumentů

Naše základní koncepce vychází z principů programu Paměť světa a také z toho, že naše digitální dokumenty, vzniklé převodem vzácných a ohrožených originálů, by měly být perspektivně přístupné alespoň v nižší kvalitě na Internetu. A to je také důvodem našich snah sjednotit lokální přístup k vysoce kvalitním datům nyní na základě CD-ROM s přístupem v Internetu. Naše dokumenty by se měly chovat stejně a základní dostupnost k nim by měla být umožněna přímo internetovskými prohlížeči. Současně vzniká ve dvou verzích speciální software, který bude schopen nejen být daleko lepším prohlížečem s určitými prvky speciálního grafického programového vybavení, ale též komfortním nástrojem pro zpracování metadat uložených spolu s dokumentem, a tím i nástrojem ke studiu a vědeckém práci. Předpokládá se, že verze freeware bude skutečně zdarma pro nekomerční využití, což nebude platit pro bohatší profesionální verzi.

Z pohledu možného tvůrce obdobných dokumentů bude k dispozici nejen příslušné DTD, ale i příslušné podpůrné programové vybavení pro generování takto definované struktury; zde se též uvažuje o kategorii freeware.

Digitální dokumenty budou zhotovovány ve dvou kvalitativních sadách, přičemž měřítkem kvality bude kvalita datových, v tomto případě obrazových souborů, zatím co struktura metadat budou v obou případech stejná. V praxi to znamená, že z každého nasnímaného obrazu - u nás probíhá přímá digitalizace s využitím digitální kamery Kodak DCS 460 - se odvodí celá řada dalších: archivní v maximální kvalitě, avšak komprimovaný v JPEG, uživatelský ve vysoké kvalitě v JPEG, internetovský v JPEG (do cca. 150 KB) a dva náhledové v GIF (cca. 50 KB a cca. 10 KB) pro základní orientaci uživatele. Samozřejmě, že do Internetu budou puštěny, až budeme mít takové možnosti, maximálně obrazy v nízké internetovské kvalitě. Ovšem i ty poskytují dostatek informací pro běžné studium, jak se lze přesvědčit na různých ukázkách na našem WWW.

Každopádně však bude v nejbližších týdnech k dispozici databáze digitalizovaných dokumentů na Internetu, která bude poskytovat aktuální informace - ty se prozatím dařilo udržovat jen se značným zpožděním na našem WWW. Zájemci najdou, jakmile to bude možné, odkaz na tuto databázi z naší hlavní stránky digitalizačního programu, který jsme nazvali Memoriae Mundi Series Bohemica.

Výsledky tohoto programu budou aplikovány i v připravované digitalizaci vzácných a ohrožených zvukových nahrávek na nedigitálních médiích.

Program digitalizace mikromédií se rozbíhá pomaleji vzhledem k finančním prostředkům, které na něj jsou v prvním roce grantu k dispozici. Letošní rok představuje první testovací fázi, ve finále je však počítáno s magnetopáskovým robotem a přístupem přes Internet. S tím počítají i plány síťového propojení Centrálního depozitáře v Hostivaři a jeho kapacita. Digitální archiv bude umístěn zde.

Pokud se podaří získat i prostředky na digitalizaci velkoplošných předloh, dojde nejen ke zkvalitnění národní bibliografie české grafiky (zejména plakáty), ale i k  postupnému zpřístupnění velkoplošných historických materiálů, jako jsou mapy a univerzitní teze.

  1. Uchování ostatních digitálních dokumentů

Funkcí digitálního archivu bude nejen monitorovat námi vyrobené kopie vzácných dokumentů a vyrábět kopie pro uživatele. Náš digitální archiv se bude v první fázi zabývat též naší sbírkou zvukových CD, ke kterým má nyní NK i právo povinného výtisku. Jejich kvalita bude prověřena a následně pravidelně monitorována, ohrožené kopie budou převedeny na nové nosiče.

Ostatní data, produkovaná v NK, se těší prozatím zájmu uživatelů. Jde především o katalogy a další databáze; totéž bude platit i produktech retrospektivní konverze, v první fázi zejména pak zpřístupňování katalogů NK v obrazové podobě, o které se v v rámci Klementina (zatím) snažíme a které bude částečně uskutečněno již letos v závislosti na množství finančních prostředků, které budeme mít nakonec k dispozici.

Z ostatních elektronických publikací, vznikajících v ČR, není NK zatím úspěšná v získávání CD-ROM na bázi povinného výtisku, neboť je celá záležitost s ohledem na autorský zákon značně sporná.

Pokud jde o elektronické on-line publikace, prozatím žádné kroky nepodnikáme, neboť jde o oblast s výskytem obrovského množství efemerních "vydavatelských" počinů na Webu. Jsem prozatím toho názoru, že nejcennější z takto poskytovaných informací budou stejně vytištěny nebo vydány případně na nějakém fyzickém médiu (CD-ROM). Není to názor nepokrokový, neboť například jedním z doporučení materiálu Rady ředitelů národních knihoven ohledně povinného výtisku elektronických publikací je i archivace určitých dat jejich vytištěním na papír.

Archivaci on-line elektronických publikací si představit lze: prvním krokem však musí být dobře stanovená kritéria jejich selekce a dobře stanovená kritéria jejich definice zejména pro případ těch publikací, které vznikají za součinnosti vícero serverů. Pravděpodobně půjde také o to rozlišit je na statické a dynamické. Uchovávání těch statických bude možná jednodušší (klasické publikování v elektronické formě), nicméně i zde bude nutné přeformátování nebo doformátování do poněkud archivnějšího tvaru. A to si vyžaduje další kapacity lidské, technické a know-how. Dosavadní grantový systém, který se slibně rozběhl, snad dokáže řešit záležitosti výzkumu a vývoje nebo časově ohraničené projekty. Řada produktů zejména výzkumu a vývoje však ústí k nastartování nových rutinních činností, které by měl krýt běžný rozpočet NK a v něm na to není prostor. To je však vážný problém do blízké budoucnosti, bohužel nejen zde, ale i v řadě klasických knihovnických činností.