Tietovarastointi

Tietovarastolla (Data Warehouse) tarkoitetaan yleensä isoa, monien lähdejärjestelmien tiedoista integroitua erillistä tietokantaa, johon säännöllisin väliajoin ladataan lähdejärjestelmistä uudet ja muuttuneet tiedot. Lähdetietojen lukua, muokkausta ja latausta kutsutaan ETL-prosessiksi. Tiedot talletetaan tietovarastoon tehokkaitten kyselyjen kannalta optimaalisessa muodossa. Tietoja hyödynnetään Business Intelligence (BI) -välineillä: raportointityökaluilla, analysointivälineillä (summakuutiot, OLAP) ja mittaristoilla (dashboard, scorecard).

DWkuvaMonissa organisaatioissa tietojärjestelmien raportointi hoidetaan vielä suoraan operatiivisesta tietokannasta, vaikka sitä ei olekaan suunniteltu kyselykäyttöä varten. Käytössä voi olla jo nykyaikaiset BI-välineet, mutta raportointi ei välttämättä enää palvele käyttäjiä ja kasvavia tietotarpeita riittävästi.

Raportoinnin ongelmia ovat esimerkiksi
- raporttien tekeminen on hidasta ja kallista (edellyttää toimittajan apua)
- omien kyselyjen ja raporttien tekeminen on hankalaa
- raporttien ajaminen on hidasta tai vaarantaa operatiivisen järjestelmän toiminnan
- tietojen yhdistely eri lähdejärjestelmien välillä on mahdotonta
- historiatiedot puuttuvat, esim. viimevuotinen organisaatiorakenne

Hyvä BI-ratkaisu parantaa kykyä tehdä päätöksiä sekä tukee organisaation strategiaa ja tavoitteisiin pääsyä!

Hyvä BI-ratkaisu ei useinkaan edellytä järeän luokan tietovaraston rakentamista, johon palaa vuosikausia aikaa ja resursseja. Tietovarasto ei ole mikään itseisarvo. Se on "pelkkä" tekninen väline, kyselyjä varten optimoitu helppokäyttöinen tietokanta, joka sisältää myös tarvittavat historiatiedot. Sinne tiedot jalostetaan ja niitä täydennetään käyttäjiä paremmin palvelevaan muotoon laskemalla valmiiksi erilaisia tunnuslukuja ja summalukuja.

Hyvä BI-ratkaisu vähentää kustannuksia parantamalla operatiivista tehokkuutta, kun oikea tieto saavuttaa oikean henkilön oikeaan aikaan. Esimerkiksi tietyt vakioraportit voidaan ajaa joka aamu ja ohjata automaattisesti niitä tarvitsevien ihmisten sähköpostiin.

TietoKaira auttaa paremman BI-ratkaisun rakentamisessa!

Tietovarastointitekniikoin on toteutettavissa tehokas kyselykanta (Data Mart), joka
- on laajennettavissa pala palalta
- ei jatkuvasti rasita operatiivista toimintaa (pelkät ajastetut, yölliset latausajot)
- on helppokäyttöinen (käyttäjien omat ad hoc -kyselyt)
- sisältää selkeät tietorakenteet (raportin tekeminen ei edellytä IT-ammattilaisen apua)
- sisältää enemmän ja valmiiksi jalostetumpaa tietoa kuin operatiivinen tietokanta (johdetut arvot, tunnusluvut, esim. ikä, odotusaika)
- mahdollistaa pitkään "piilossa" olleiden strukturoimattomien tietojen raportoinnin
- mahdollistaa tietojen yhdistelemisen
- sisältää myös tarvittavat historiatiedot jotka voivat puuttua operatiivisesta tietokannasta
- mahdollistaa monimutkaisten päättelyjen tekemisen valmiiksi käyttäjää varten
- mahdollistaa käytön eri välineillä, esim. excelillä suoraan
- on hyvin kuvattu ja dokumentoitu (metatieto)
- on suorituskykyinen (optimoidut kyselyrakenteet)

Tietovarastokannoissa dimensionaalinen malli (tai tähtimalli) on tavallinen ja BI-välineiden hyvin tukema tietorakenne. Isot tietovarastot (Enterprise Data Warehouse, EDW) eivät välttämättä ole kyselyjen suorana kohteena vaan tietovarastosta lohkaistaan pienempiä aihekokonaisuuksia, datamartteja, jotka palvelevat käyttäjien tarpeita. Silloin tietovaraston tietorakenteet mallinnetaan usein Data Vault -menetelmällä ja vasta datamarteissa sovelletaan dimensionaalisia tietorakenteita.

Referenssit

KulasDW-tietovaraston kehitys, OYS Erva -alueen sairaanhoitopiirit, 2015-.