Tietovaraston testauksen kattavuuden parantaminen prosessin avulla

Tiedon keräys ja analysointi auttaa yrityksiä päätöksenteossa sekä liiketoiminnan ennustamisessa sekä suunnittelussa. Tietoa on mahdollista kerätä eri järjestelmistä ja yhdistää ne kokonaisuudeksi tietovaraston avulla. Tietovaraston riittämättömän testauksen takia sinne saattaa jäädä virheitä, minkä takia käyttäjä ei luota tietovarastossa olevaan tietoon tai tekee sen pohjalta vääriä päätelmiä (Hovi ym. 2009, 9).  

Tietovaraston testausprosessin kehittäminen oli osa Laura Kikaksen opinnäytetyötä ”Tietovaraston testausprosessin kehittäminen”. Opinnäytetyön tutkimuksen tavoitteena oli selvittää voiko työssä kehitettyä prosessia käyttää tietovaraston testaukseen.  

Kuva 1. Tietovaraston testauksen avainsanoja (Kuva: Laura Kikas)

Testauskohteiden tunnistaminen 

Tietovaraston testaukseen liittyy monia eri vaiheita, joita toistetaan usein eri tietovarastojen kehitysprojekteissa. Kuvassa 1 on esitetty tietovaraston testaukseen liittyviä avainsanoja. Kaksi laajimmin testausta vaativaa osa-aluetta ovat ETL-testaus ja datan testaus. ETL tarkoittaa tiedon poimintaa, muokkausta ja latausta (Kimball ym. 2008, 357). Muita testattavia osa-alueita ovat tietoturva, varmuuskopioiden testaus, suorituskyky- ja kuormitustestaus ja tietomallin testaus. Tietovaraston virhetilanteisiin saattavat johtaa inhimilliset tekijät, väärät tietosisältörajaukset ja esimerkiksi liiketoimintatietämyksen puuttuminen (Kikas 2020). 

Nykyisin yksi tärkeimmistä testauskohteista on tietoturva ja se, että tietosuojaperiaatteita noudatetaan. EU:n tietosuojaperiaatteiden mukaan henkilötietoja on käsiteltävä luottamuksellisesti ja turvallisesti, eikä niitä saa kerätä kuin tarvittavan määrän. Tämän takia on erityisen tärkeää, että tietovaraston tietoja näkee vain sille määrätty henkilöstö. (Tietosuojavaltuutetun toimisto 2020.) 

Tietovaraston testauksen avuksi voi luoda erilaisia prosesseja, jotka tukevat tietovaraston systemaattista testausta. Opinnäytetyössä on esitetty prosessi liittyen ETL:n ja datan testaukseen. Prosessiin kuuluu vaatimuksien määrittely, mikä sisältää tietolähteiden testaamisen ja datan profiloinnin. Prosessin seuraava vaihe on suunnittelu- ja toteutusvaihe, jonka lopputuloksena on mallinnettu tietovarasto, jossa on testattu esimerkiksi tietosisältörajaukset ja lataus- ja tietovarastoarkkitehtuuri. Prosessiin sisältyy myös laadunvarmennusvaihe, jonka tarkoituksena on testata koko tietovaraston latausketju alusta loppuun ja testata, että data näkyy ja linkittyy oikein. Prosessia testattiin esimerkin avulla, mikä osoitti, että kyseiseen tapaukseen suunniteltu ETL-testausmalli toimi.  (Kikas 2020.) 

Kirjoittajat 

Laura Kikas valmistui LAB-ammattikorkeakoulusta tekniikan alan insinööriksi (ylempi AMK), digitaaliset ratkaisut -koulutuksesta ja toimii Business Intelligence -konsulttina. 

Lehtori Minna Asplund, TkL, toimii koordinaattorina insinööri (ylempi AMK), digitaaliset ratkaisut -koulutuksessa ja ohjasi opinnäytetyötä. 

Lähteet 

Hovi, A., Hervonen, H. & Koistinen, H. 2009. Tietovarastot ja Business Intelligence. Jyväskylä: WSOY. 

Kikas, L. 2020. Tietovaraston testausprosessin kehittäminen. YAMK-opinnäytetyö. LAB-ammattikorkeakoulu tekniikan ala. Lahti. [Viitattu 24.11.2020]. Saatavissa: http://urn.fi/URN:NBN:fi:amk-2020112323766 

Kimball R., Ross, M., Thornthwaite W., Mundy, J. & Becker, B. 2008. The Data Warehouse Lifecycle Toolkit. Indianapolis, Indiana: John Wiley & Sons, Incorporated. 

Tietosuojavaltuutetun toimisto. 2020. Usein kysyttyä EU:n tietosuoja-asetuksesta. [Viitattu 7.11.2020]. Saatavissa: https://tietosuoja.fi/gdpr 

Linkit 

Kikas, L. 2020. Tietovaraston testausprosessin kehittäminen. YAMK-opinnäytetyö. LAB-ammattikorkeakoulu tekniikan ala. Lahti. [Viitattu 20.1.2021]. Saatavissa: http://urn.fi/URN:NBN:fi:amk-2020112323766 

Jätä kommentti

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *