Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
Lataa Arkistot, yhteiskunnan toimiva muisti -oppikirja - Arkistolaitos
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
ARKISTOT YHTEISKUNNAN TOIMIVA MUISTI<br />
minen rakenteesta. Semanttisen webin kehittämisellä pyritään antamaan tuki nykyistä monipuolisemmalle<br />
tiedon etsimiselle, datan integroimiselle eri lähteistä sekä automatisoinnille.<br />
4.3.5 Tietokannat<br />
Asiankäsittelyjärjestelmiä on otettu käyttöön virastoissa 1990-luvun alkupuolelta lähtien. Jo ennen<br />
tätä viranomaiset ovat pitkään hyödyntäneet toiminnassaan erilaisia tietokantoja. Tietokanta voidaan<br />
määritellä kokoelmaksi tietoja, jotka liittyvät tiettyyn kohteeseen ja joita yksi tai useampi<br />
tietojärjestelmä käyttää ja päivittää. Perinteinen tietokanta koostuu tietueista ja ne puolestaan tietokentistä.<br />
Nykyään yleisimpiä tietokantoja ovat ns. relaatiotietokannat, joissa tiedot ovat tarkkaan<br />
määritellyissä tauluissa sarakkeisiin ja riveihin strukturoituina. Monipuolinen tiedonhaku ja tietokannan<br />
rakenteellinen joustavuus ovat relaatiotietokannan vahvuuksia. Tietokantojen koko, rakenne<br />
ja käyttötarkoitus vaihtelevat suuresti.<br />
Tietojen kontekstin ja todistusvoimaisuuden varmistaminen on tärkeää myös tietokantojen yhteydessä.<br />
Sähköisiä asiakirjoja ja asiankäsittelyjärjestelmiä varten on olemassa metatietomäärityksiä,<br />
tietokantojen kohdalla tilanne on ongelmallisempi. Tietokannoissa oleva tieto ei ole yhtä “kiinteää”<br />
kuin asiankäsittelyjärjestelmissä, joissa dataa käsitellään dokumenttien tapaan. Tietokannoissa<br />
olevaa tietoa yhdistellään tiettyjen sääntöjen mukaan kulloisiakin tarpeita varten. Jokaisen käyttötilanteen<br />
dokumentoiminen erikseen metadatan avulla ei yleensä ole mahdollista tai mielekästä.<br />
Tietokantoihin tallennettu tieto on usein myös vaihtuvaa: vanhaa tietoa muokataan tai poistetaan,<br />
uutta lisätään. Tämä voi olla ongelmallista tietojen todistusvoimaisuuden kannalta (sekä oikeudellisessa<br />
että tutkimuksellisessa mielessä). Asiaan on periaatteessa kaksi ratkaisua. Tietokannasta<br />
voidaan säilyttää otoksina tietyn ajankohdan tiedot (esim. tiedot vuosittain 1. tammikuuta olleen<br />
tilanteen mukaan). Toisena vaihtoehtona on tallettaa automaattisesti kaikki muutostiedot ns. historiatiedostoon,<br />
jolloin on mahdollistaa tarvittaessa rekonstruoida tietokannan tila haluttuna ajankohtana.<br />
Vaihtoehtoja punnittaessa on otettava huomioon tietokannan luonne. Jos tietokantaa<br />
käytetään rutiininomaiseen asioiden seurantaan, toimeenpanoon tai muuhun vastaavan eikä se<br />
muodosta päätöksenteon pohja-aineistoa ja/tai sisällä tutkimuksellisesti arvokasta tietoa, kumpikaan<br />
em. vaihtoehdoista ei ole tarpeen (jos arkistonmuodostajan toiminnalliset tarpeet eivät sitä<br />
edellytä). Silloin kun on kysymys viranomaisten tietokantojen tai niissä olevien tietojen pysyvästä<br />
säilyttämisestä, otosten ja historiatiedostojen ottamisesta päättää arkistolaitos.<br />
Tietokantojen dokumentointiin voidaan käyttää ns. data dictionary -järjestelmiä. Data dictionary<br />
(tai directory) on automatisoitu työkalu tietojärjestelmiä kuvaavan tiedon kokoamista ja organisointia<br />
varten. Data dictionary sisältää metatietoa käytössä olevista ohjelmista, tietokannan rakenteesta,<br />
tietojen käsittelyprosesseista, käyttäjistä ym. relevanteista metatiedoista. Data dictionary voi<br />
olla erillinen sovellus tai kiinteä osa tietokantaohjelmaa. Mikäli tietokannan tiedot (tai osa niistä)<br />
ovat pysyvästi säilytettäviä, myös data dictionaryn tiedot (tai osa niistä) tulee säilyttää pysyvästi.<br />
Kyseisten järjestelmien suunnittelua varten on olemassa ISO- standardi IRDS (Information Resource<br />
Dictionary System, ISO/IEC 10027).<br />
4.3.6 Tiedonhaku<br />
Sähköisten tietojärjestelmien ja -aineistojen käytettävyydessä lyhyellä aikavälillä on yleensä muokattavuuden<br />
ohella keskeistä tiedonhaun monipuolisuus ja nopeus. Tiedonhakuun on monia teknisiä<br />
ratkaisuja. Vapaassa tekstihaussa ohjelma etsii hakuehdoksi asetetun merkkijonon kaikki<br />
esiintymät tiedostosta. Tietyin teknisin ratkaisuin haku saadaan laajojenkin aineistojen osalta nopeaksi.<br />
Vapaa tekstihaku soveltuu sellaisenaan vain tekstiasiakirjoille, ei esim. kuvamuotoon skan-<br />
76