Hallittu pilvi: Varmista yrityksesi pilven luotettavuus ja käyttövarmuus
Oikein toteutettu pilvi on luotettava liiketoiminta-alusta, jossa palvelut ovat saatavilla hyvin ja pilvi on käyttövarma. Pilvi itsessään tuo luotettavuutta, koska pilvipalveluita tarjoavat suuret yritykset ovat panostaneet infraan ja sen skaalautuvuuteen sekä vikasietoisuuteen enemmän kuin moni käyttäjäyritys itse pystyisi koskaan tekemään. Siitä huolimatta luotettavan kokonaisuuden rakentaminen edellyttää systemaattisia toimenpiteitä myös pilveä käyttävältä yritykseltä. Lue, kuinka varmistat yrityksesi pilven korkean luotettavuuden.
Pilvipalveluiden luotettavuus tarkoittaa käytännössä palveluiden katkotonta saatavuutta, saavutettavuutta sekä kykyä toipua mahdollisista häiriötilanteista nopeasti ja ilman pysyviä vahinkoja. Palveluntarjoajat pystyvät toimittamaan jo lähtökohtaisesti korkeaa luotettavuutta, mutta tarvittaessa luotettavuus voidaan erilaisin järjestelyin korottaa erittäin korkealle tasolle.
Pilvi-infran luotettavuuden mittarina käytetään yleisesti sitä aikaa, jonka pilvipalvelu on alhaalla (downtime) ja käyttäjien saavuttamattomissa. Tämä voi palvelutasosta riippuen tarkoittaa vaikkapa muutamaa tuntia vuodessa. Muita näkökulmia luotettavuuteen on pilvipalvelun tehokkuus eli nopeus sekä tietoturvan taso.
Määrittele luotettavuuden ja käyttövarmuuden tarve kriittisimpien järjestelmiesi mukaan
Yrityksen tulee määritellä, miten kriittisiä eri järjestelmät ovat sen liiketoiminnalle, ja suunnitella sen mukaan vaatimukset hankittavien pilvipalveluiden palvelutasolle:
- Downtime: Mikä on käytössä olevien ratkaisujen sallittu downtime? Saako palvelu olla alhaalla sekunnin vai tunnin vai päivän vuodessa? Tämä riippuu palvelun katkeamisen seurauksista: mitä vaikutuksia asiakkaisiin ja yrityksen omaan toimintaan tällä on, mitä kustannuksia ja kerrannaisvaikutuksia silloin syntyy.
- Recovery: Mikä on sallittu ja suunniteltu nopeus käyttökatkoksista ja ongelmista toipumiseen? Kun odottamaton ongelmatilanne tulee eteen ja palvelut ovat alhaalla, pyritäänkö ne samaan ylös tunnissa vai vuorokaudessa, ja missä järjestyksessä palveluita palautetaan? Onko palauttamista harjoiteltu ja tiedetäänkö kaikissa tilanteissa, kenen vastuulla toimenpiteet ovat?
- Redundancy: Millä tavoin järjestelmien sisältämä data, käyttäjätiedot ja asetukset turvataan — kahdentamalla ja hajauttamalla tieto useisiin paikkoihin sekä varmuuskopioihin paikallisesti ja maantieteellisesti? Mikä on riittävä varmuustaso? Kuinka tätä hajautusta ylläpidetään ja päivitetään tarpeen mukaan?
Hallittu pilvi perustuu siihen, että yllä mainitut avainparametrit on määritelty ja viety käytäntöön. Tärkeää on evaluoida tarkkaan järjestelmien kriittisyys liiketoiminnan kannalta. Kun pilvi-infran käyttö on laajaa ja monitasoista, eri järjestelmien välillä täytyy määritellä prioriteetit — on turha maksaa ei-kriittisen järjestelmän luotettavuuden nostamisesta, jos sen liiketoimintavaikutus on vähäinen. Riskienhallinta on aina myös budjetointikysymys.
Pilven luotettavuus on hyvä - ja sen voi nostaa vielä korkeammalle
Suurten palveluntarjoajien (kuten Microsoft Azure, Amazon AWS ja Google Cloud) luotettavuus on erittäin hyvä. Perustaso ei silti välttämättä riitä. Onneksi pilvi pystyy vastaamaan koviinkin vaatimuksiin ja tekee sen potentiaalisesti kustannustehokkaammin ja varmemmin kuin vastaavan tason saavuttaminen omilla on-premises-järjestelmillä ja -laitteistolla.
Jos perustasolla palvelutasosopimus lupaa esimerkiksi 99 % luotettavuuden, voi valikoiduissa järjestelmissä olla perusteltua pyrkiä esimerkiksi 99,999 % luotettavuustasolle tai korostaa jatkuvasti saatavilla olevaa korkeaa laskentatehoa, jota muiden laskentaa vuokraavien käyttäjien käytön intensiivisyys ei pääse heilauttamaan. Tämä ja vieläkin korkeampi luotettavuustaso onnistuu pilvessä, mutta vaatii toki investointeja niin pilvipalveluiden osalta kuin itse järjestelmäratkaisunkin osalta, jotta järjestelmä toimii ja pystyy hyödyntämään pilven korkeampaa luotettavuustasoa.
Palvelutyypistä riippuen (IaaS, PaaS, SaaS) yritys ottaa itse vastuulleen suuremman tai pienemmän joukon järjestettäviä asioita.
Palautumiskyky on kriittinen tekijä liiketoiminnan jatkuvuuden kannalta
Koska kaikki työ ja kaikki liiketoiminta tehdään nykyisin merkittävältä osin verkon ja tietojärjestelmien avulla (koskee niin rekkakuskeja, hissihuoltoa kuin maatalouttakin), ovat kaikki häiriötilanteet pitkään jatkuessaan liiketoiminnalle tuhoisia.
Toipumissuunnittelussa (disaster recovery) onkin keskeistä suunnitella ja testata sekä harjoitella, kuinka järjestelmät nostetaan katkon jälkeen takaisin pystyyn. Varmaa on se, että vähänkin laajemman järjestelmän ollessa kyseessä, kertaakaan testaamatta tehty palautus ei sillä ihan ensimmäisellä kerralla tehtäessä ongelmitta onnistu.
Palautumiseen menevä aika on aina kriittinen tekijä, mutta mahdollista palautumisaikaa säätelee vahvasti se, mikä on järkevä investointi palautumisen nopeuttamiseksi.
- RTO (Recovery Time Objective) on se tavoiteaika, jossa häiriöstä halutaan toipua. Käytännössä tätä säätelee se, minkä ajanjakson jälkeen katkon kerrannaisvaikutukset alkavat tehdä yhä enemmän ja enemmän haittaa liiketoiminnalle. Kriittisten järjestelmien osalta tämä voi tarkoittaa sitä, että katkon kestäessä esimerkiksi yli kaksi päivää, logistiikka puuroutuu, asiakkaat alkavat irtisanoa asiakassuhteitaan tai vaatia korvauksia, julkisuuteen leviävä tieto pitkästä ongelmasta alkaa aiheuttaa mainehaittaa jne. Vaikka liiketoiminnat haluaisivat kaikissa tilanteissa pikaisen palautumisen, se voi tarkoittaa niin suuria kustannuksia valmiuden luomiseen, että tämä ei ole enää liiketaloudellisesti järkevää. Riskienhallinta on suunnitelmallista tasapainottelua todennäköisyyksien kanssa.
- RPO (Recovery Point Objective) on puolestaan käytännön tasolla varmuuskopioinnin tiheys. Usein käytetty esimerkki on pankkipalvelut, jossa on tarpeen varmuuskopioida aivan kaikki tapahtumat ja transaktiot. Kopiointia tapahtuu siis joka sekunti ja tällä on merkittävä kustannus. Monissa palveluissa voidaan luottaa siihen, että esimerkiksi joka minuutti tapahtuva backup on riittävä ja jos työtä menetetään minuutin verran, se ei ole niin kriittistä käyttäjän ja liiketoiminnan kannalta — kun oletuksena kuitenkin on, että katkoja tapahtuu harvoin.
Kriittiset toiminnot täytyy pitää aina dokumentoituna ajantasaisesti. Versionhallinnan ja pilvi-infran luomisessa käytetty koodi täytyy olla versionhallinnan kautta palautettavissa kaikissa tilanteissa. Datan säilyvyyden varmistamisessa ja palauttamisessa voi olla tarpeen käyttää eri lokaatioita maantieteellisesti. Tällä varmistetaan datan säilyvyys maantieteellisessä katastrofissa ja tuodaan se kansainvälisessä liiketoiminnassa lähemmäksi eri maayksiköitä tai mantereihin jakautuvia liiketoiminta-alueita.
Liiketoiminnot mukaan päätöksentekoon
Keskustelu järjestelmien ja datan palautumisaikojen ja varmuuskopioinnin tiheyden RTO- ja RPO-tasoista sekä niiden edellyttämistä investoinneista käydään liiketoimintojen kanssa. Suunnittelussa on kysymys johtamisesta ja liiketoimintariskin hallinnasta, ei pelkästään teknologiasta.
Luotettavuus ja käyttövarmuus sekä liiketoiminnan jatkuvuuden varmistaminen pohjautuvat sekä hallintomalliin että teknologiaan ja osaamiseen. Ylimmällä johdolla täytyy olla riittävä tietoisuus luotettavuuteen liittyvistä asioista, jotta se kykenee päättämään ja resursoimaan toimenpiteet halutun riskitason mukaisiksi.
Lisätietoja:
Haluatko jutella lisää hallitun pilven mahdollisuuksista sekä vaatimuksista? Ota yhteyttä meihin Fellowmindilla, niin keskustellaan yrityksesi tilanteesta lisää.
Voit myös lukea aiemmin kirjoittamiamme blogeja aiheesta:
Mats Hägglund
Mats työskentelee Fellowmindilla Advisorin ja teknisen arkkitehdin roolissa. Häntä motivoi asiakasyritysten liiketoiminnan kehittäminen teknologian avulla, olipa kyseessä työntekijöiden käyttämät prosessit, työkalut tai ohjelmistot. Ota yhteyttä Matsiin: mats.hagglund@fellowmind.fi tai 050 585 0798
Otto Hintikka
Business & People Lead - Cloud Platforms
Otto on uudesta teknologiasta innostuva tulevaisuusoptimisti. Otta haluaa tukea Fellowmindin asiakkaiden liiketoiminnan kannattavuutta ja kasvua - digitalisaation, dataan pohjautuvien ratkaisujen ja teknologian avulla.
Ota yhteyttä: otto.hintikka@fellowmind.fi tai +358 44 572 3171