12.07.2015 Views

digitalizace s google a její vztah k ndk - Vědecká knihovna v Olomouci

digitalizace s google a její vztah k ndk - Vědecká knihovna v Olomouci

digitalizace s google a její vztah k ndk - Vědecká knihovna v Olomouci

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

DIGITALIZACE S GOOGLE A JEJÍ VZTAH K NDK – IOPDruhou linií bude další práce s plnými texty, které Google pořídí technologií OCR 18a v rámci Google Book Search je bude využívat pro vyhledávání, protože příslušné úsekytextu budou korelovány k odpovídajícím obrazům. Bude vhodné, ne-li přímo nutné tytoautomaticky vzniklé plné texty korigovat tak, aby z nich vznikl surový podklad způsobilý propoužití při tvorbě pragmatických a kontextuálních edic.Toto je aktivita zcela nová, kterou až dosud nikdo od knihoven a historických knihovníkůneočekával, a tedy ji na nich ani nepožadoval. Nyní jsou jí schopni pravděpodobnějen nemnozí pracovníci výzkumu a vývoje Národní knihovny ČR, v zásadě však nikoli standardníhistoričtí knihovníci, zejména ne ti, kteří pracují se starými tisky. Jelikož ve <strong>vztah</strong>uk plným textům pouze tato činnost může vytvořit dodatečnou informaci a koncovému uživateliposkytnout přidanou hodnotu, bude nutno se tohoto úkolu zhostit přes jistý odporpracovníků a přes pravděpodobné pochybnosti instituce; bez něj totiž <strong>knihovna</strong> nenávratněztratí komparativní výhodu oproti obecnému globálními prostředí vytvořenému společnostíGoogle a v důsledku toho mohou vzniknout více méně oprávněné pochybnosti o důvodujejí existence. Takže i v této linii se bude muset tato činnost koordinovat s institucionálnímvýzkumem a vývojem, případně počítat s externími silami a domácími, zahraničními i mezinárodnímigrantovými projekty. A pro útvar historických a hudebních fondů platí i zde stejnémemento jako v předchozím případě.Tyto dvě linie (obohacování popisných záznamů a zpracovávání plných textů) se spojína vyšším stupni. Zde bude muset fakticky dojít ke koordinaci globálního síťového prostředína jedné straně a personalizovaného virtuálního prostředí knihoven (čímž už nynírozumíme digitální knihovny, nikoli tradiční kamenné instituce) na straně druhé. Přičemžjednomu zůstane komparativní výhoda robustnosti a masivnosti a druhému specializacea personalizace.Pak bude možné kombinovat a integrovat na jedné straně ontologické a prosté textovévyhledávání týkající se metadat-popisných katalogových záznamů (terciárních dokumentů)a na straně druhé vyhledávání sémantické, plnotextové a bibliografické týkající se dat-plnýchtextů (primárních a sekundárních dokumentů). 19 Zároveň bude možno využívat v návaznostina nový sofistikovanější druh vyhledávání také výsledky externích nástrojů služeb koordinovanýchs Manuscriptoriem (např. automatické srovnávání plných textů a jeho statistickévyhodnocování, jakož i jeho grafická reprezentace, nebo automatické obohacování popisnýchmetadat o informaci o typu obsahu digitálních obrazových kopií, či korelace narativnícha diplomatických historických textů s georeferencovaným mapovým zobrazením apod.).Kromě toho personalizované prostředí Manuscriptoria umožní digitální síťové publikovánísekundárních dokumentů týkajících se písemného dokumentárního dědictví vůbec a primárníchči originálních historických dokumentů zvláště. K tomu však ještě chybí transnacionálníjednoznačná identifikace (persistentní adresování komplexních digitálních dokumentův příslušných digitálních knihovnách). Je totiž zřejmé, že v důsledku rozsáhlé mezinárodní18 V rámci <strong>digitalizace</strong> novodobých fondů v Národní knihovně ČR se také užívá technologie OCR, srv.FOLTÝN, T. Účast NK ČR v projektu TELplus – vytváření OCR souborů. In: Knihovny současnosti 2009.Brno: SDRUK, 2009, s. 159–166, dostupné z URL: http://www.svkos.cz/data/xinha/sdruk/2009-6-159.pdf[cit. 2012-07-08]; POLIŠENSKÝ, J. – LEHRL, O. CODEG 4 – nástroj pro podporu OCR a tvorbu rozšířenýchmetadat. In: Knihovny současnosti 2011. Ostrava: SDRUK, 2011, s. 80–89, dostupné z URL: http://www.svkos.cz/data/xinha/sdruk/ks2011/2011_KKS_Polisensky.pdf [cit. 2012-07-08].19 Viz SCHÄFER, U. The Searchbench – Combining Sentence-Semantic, Full Text and Bibliographic Searchin Digital Libraries, dostupné z URL: http://www.utlib.ee/liber2012/index.php?id=programme&item=acc_papers [cit. 2012-07-08].137

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!