08.02.2015 Views

Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos

Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos

Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ARKISTOT YHTEISKUNNAN TOIMIVA MUISTI<br />

minen rakenteesta. Semanttisen webin kehittämisellä pyritään antamaan tuki nykyistä monipuolisemmalle<br />

tiedon etsimiselle, datan integroimiselle eri lähteistä sekä automatisoinnille.<br />

4.3.5 Tietokannat<br />

Asiankäsittelyjärjestelmiä on otettu käyttöön virastoissa 1990-luvun alkupuolelta lähtien. Jo ennen<br />

tätä viranomaiset ovat pitkään hyödyntäneet toiminnassaan erilaisia tietokantoja. Tietokanta voidaan<br />

määritellä kokoelmaksi tietoja, jotka liittyvät tiettyyn kohteeseen ja joita yksi tai useampi<br />

tietojärjestelmä käyttää ja päivittää. Perinteinen tietokanta koostuu tietueista ja ne puolestaan tietokentistä.<br />

Nykyään yleisimpiä tietokantoja ovat ns. relaatiotietokannat, joissa tiedot ovat tarkkaan<br />

määritellyissä tauluissa sarakkeisiin ja riveihin strukturoituina. Monipuolinen tiedonhaku ja tietokannan<br />

rakenteellinen joustavuus ovat relaatiotietokannan vahvuuksia. Tietokantojen koko, rakenne<br />

ja käyttötarkoitus vaihtelevat suuresti.<br />

Tietojen kontekstin ja todistusvoimaisuuden varmistaminen on tärkeää myös tietokantojen yhteydessä.<br />

Sähköisiä asiakirjoja ja asiankäsittelyjärjestelmiä varten on olemassa metatietomäärityksiä,<br />

tietokantojen kohdalla tilanne on ongelmallisempi. Tietokannoissa oleva tieto ei ole yhtä “kiinteää”<br />

kuin asiankäsittelyjärjestelmissä, joissa dataa käsitellään dokumenttien tapaan. Tietokannoissa<br />

olevaa tietoa yhdistellään tiettyjen sääntöjen mukaan kulloisiakin tarpeita varten. Jokaisen käyttötilanteen<br />

dokumentoiminen erikseen metadatan avulla ei yleensä ole mahdollista tai mielekästä.<br />

Tietokantoihin tallennettu tieto on usein myös vaihtuvaa: vanhaa tietoa muokataan tai poistetaan,<br />

uutta lisätään. Tämä voi olla ongelmallista tietojen todistusvoimaisuuden kannalta (sekä oikeudellisessa<br />

että tutkimuksellisessa mielessä). Asiaan on periaatteessa kaksi ratkaisua. Tietokannasta<br />

voidaan säilyttää otoksina tietyn ajankohdan tiedot (esim. tiedot vuosittain 1. tammikuuta olleen<br />

tilanteen mukaan). Toisena vaihtoehtona on tallettaa automaattisesti kaikki muutostiedot ns. historiatiedostoon,<br />

jolloin on mahdollistaa tarvittaessa rekonstruoida tietokannan tila haluttuna ajankohtana.<br />

Vaihtoehtoja punnittaessa on otettava huomioon tietokannan luonne. Jos tietokantaa<br />

käytetään rutiininomaiseen asioiden seurantaan, toimeenpanoon tai muuhun vastaavan eikä se<br />

muodosta päätöksenteon pohja-aineistoa ja/tai sisällä tutkimuksellisesti arvokasta tietoa, kumpikaan<br />

em. vaihtoehdoista ei ole tarpeen (jos arkistonmuodostajan toiminnalliset tarpeet eivät sitä<br />

edellytä). Silloin kun on kysymys viranomaisten tietokantojen tai niissä olevien tietojen pysyvästä<br />

säilyttämisestä, otosten ja historiatiedostojen ottamisesta päättää arkistolaitos.<br />

Tietokantojen dokumentointiin voidaan käyttää ns. data dictionary -järjestelmiä. Data dictionary<br />

(tai directory) on automatisoitu työkalu tietojärjestelmiä kuvaavan tiedon kokoamista ja organisointia<br />

varten. Data dictionary sisältää metatietoa käytössä olevista ohjelmista, tietokannan rakenteesta,<br />

tietojen käsittelyprosesseista, käyttäjistä ym. relevanteista metatiedoista. Data dictionary voi<br />

olla erillinen sovellus tai kiinteä osa tietokantaohjelmaa. Mikäli tietokannan tiedot (tai osa niistä)<br />

ovat pysyvästi säilytettäviä, myös data dictionaryn tiedot (tai osa niistä) tulee säilyttää pysyvästi.<br />

Kyseisten järjestelmien suunnittelua varten on olemassa ISO- standardi IRDS (Information Resource<br />

Dictionary System, ISO/IEC 10027).<br />

4.3.6 Tiedonhaku<br />

Sähköisten tietojärjestelmien ja -aineistojen käytettävyydessä lyhyellä aikavälillä on yleensä muokattavuuden<br />

ohella keskeistä tiedonhaun monipuolisuus ja nopeus. Tiedonhakuun on monia teknisiä<br />

ratkaisuja. Vapaassa tekstihaussa ohjelma etsii hakuehdoksi asetetun merkkijonon kaikki<br />

esiintymät tiedostosta. Tietyin teknisin ratkaisuin haku saadaan laajojenkin aineistojen osalta nopeaksi.<br />

Vapaa tekstihaku soveltuu sellaisenaan vain tekstiasiakirjoille, ei esim. kuvamuotoon skan-<br />

76

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!