torstai 10. lokakuuta 2024

Siirtyminen pois relaatiotietokannoista on vaikeaa.

 


Yllä: Tietokanta SQL-serverillä. 

“NoSQL (englannin sanoista Not only SQL) on käsite, jolla kuvataan perinteisestä relaatiomallista poikkeavia tietokantoja. Nämä tietokannat eivät seuraa mitään kiinteästi määrättyä taulukko skeemaa, minkä ansiosta ne skaalautuvat hyvin horisontaalisesti. (Wikipedia, NoSQL)

Tietokantojen rooli nykyisessä tietojenkäsittelyssä on keskeinen. Tietokantojen tehtävä on tallentaa sekä lajitella tietoa, mitä tietojärjestelmä pitää sisällään. Eli esimerkiksi robottien kohdalla kaikki niiden tiedot ja taidot ovat tietokannoissa. Ja tietokannat ja niiden verkottuminen ovat keskeisessä roolissa myös tekoälyjen eli laajojen kielimallien toiminnassa. SQL eli relaatiotietokantojen ongelma on ollut niiden hidastuminen käytettävän datamäärän kasvaessa. Joten tuon takia on kehitetty uusi tietokantamalli, jota kutsutaan NoSQL tietokannaksi. 

Miksi NoSQL tietokannat eivät toimi kuten niiden pitäisi? Syy tähän löytyy siitä, että meidät kaikki koulutetaan oppilaitoksissa käsittelemään relaatiotietokantoja. Ja tietokantojen relaatiomallit ovat asioita, joihin olemme tottuneet. Relaatiotietokannat käyttävät SQL kieltä ohjaamaan tietokantojen toimintaa. NoSQL luotiin valtavien datamäärien käsittelyyn sekä hallintaan, eli sen pitäisi olla joustava sekä kaikin tavoin monipuolisempi. Mutta ongelma on siinä, että uuden tuotteen käyttöönotto vaatii totuttelua. 

Yllä: Relaatiotietokanta (Wikipedia,Relaatiotietokanta)

Siis siirtyminen uuteen tehokkaampaan malliin vaatii aina siirtymäaikaa. Ja henkilön joka on vuosikymmeniä tehnyt työtä vanhan mallin kanssa on tietenkin alussa hankalaa opetella uusia malleja. Myös tietojenkäsittelyn koulutus pitää räätälöidä uudelleen siten, että se huomioi uusia tekniikoita kuten tekoälyn sekä sitä tukevan infrastruktuurin ja tietokantajärjestelmän paremmin. Tekoälyn kohdalla on käymässä niin, että koko ICT maailmaa tulee koskemaan mullistusten sarja, kun kaikki järjestelmät sekä tukijärjestelmät pitää sopeuttaa uudelle työkalulle sopiviksi. Eli kuten huomaamme, niin tekoäly ei ole yksipuolinen toimija.

Se työskentelee yhteistyössä käyttäjänsä kanssa. Ja käyttäjien on omalta osaltaan sopeuduttava infrastruktuuri muutokseen, ja tiedostettava se, että tekoäly on tullut jäädäkseen. Mikäli tekoälyä osataan käyttää oikein, niin sen käyttö nopeuttaa prosesseja, jos sitä käytetään oikein. Jos tekoälyä käytetään väärin eli sille annetut komennot ovat huonosti muotoiltuja tai niiden antajat eivät ymmärrä mitä heidän pitäisi tehdä, niin silloin tietenkään tekoäly ei osaa tehdä mitään oikein. Tekoälyn manipuloiminen tapahtuu enemmänkin lähteiden kautta, eli kotisivujen sisältöä pyritään muuttamaan tai vastaavaa kuin kielimallia itseään muuttamalla. 



 



Yllä näemme miten NoSQL tietokanta eroaa SQL tietokannasta. Eli kyseinen malli on joustavampi kuin SQL, mutta samalla sen käyttöönotto vaatii totuttelua. Eikä tämä ole ensimmäinen kerta, kun ICT alalla on työläisiä sopeutettu uusien välineiden mukaiseksi. Tämä toimintamalli jossa käyttäjät sopeutetaan järjestelmään on kohdannut kritiikkiä. Joten ehkä joskus joku tekee sellaisen väitöskirjan, jossa puhutaan järjestelmien mukauttamisesta käyttäjien mukaiseksi. Kuitenkin tällä hetkellä ajatellaan siten, että uusia ominaisuuksia tuodaan käyttäjille ilman että heiltä kysytään yhtään mitään. Tämä tarkoittaa sitä, että alan trendi on ainakin toistaiseksi ollut se, että käyttäjien pitää sopeuttaa osaamisensa uusien välineiden mukaiseksi. 

Relaatiotietokannoista luopuminen on sikäli vaativaa, että tietenkin NoSQL vaatii koulutusta sekä opettelua. Mutta se mikä tekee nimenomaan NoSQLstä hiukan hankalan on se, että sen etujen hyödyntäminen vaatii todella suurta datamassaa. Tai toisin sanoen datamassan määrän pitää olla todella suuri, jotta NoSQLn edut tulevat esiin. Eli jos dataa on melko pieni määrä, niin silloin periaatteessa on aivan sama, että millaisia tietokantoja käytetään. 

Tilanne on vähän sama jos käsittelemme vaikkapa viidentoista asiakkaan osoite- ja muita tietoja  tietokantakiihdyttimen avulla. Tällaiset välineet on kehitetty käsittelemään valtavia datamassoja, eli miljoonia tai miljardeja kirjauksia päivässä. Nuo tietokannan hallintasovellukset voivat tietenkin käsitellä 15 nimeä, mutta niistä saatava hyöty on tuolloin vähäinen. 

Ja jonkun alle 15  asiakkaan mikrotason yrittäjän asiakkuushallinta voidaan periaatteessa tehdä vaikka Excel-taulukon tai paperin ja kynän avulla. Eli tietomäärän pitää olla sellaisella tasolla, että tietokone voidaan todeta tehokkaammaksi kuin  paperi ja kynä. Kun sitten lähdetään tutkimaan NoSQL tietokantojen eroja relaatio- eli SQL tietokantoihin nähden, niin tietenkin uusi malli on erilainen kuin vanha. Se että ohjelmisto kerää tietoa laajalta alueelta sekä samalla myös lajittelee sitä aiheuttaa ongelmia. Nimittäin valtavan datamassan käsittely on haastavaa. Jos tietokone tai tekoäly lataa jotain tietokoneelle, niin tuo tieto pitäisi voida varmistaa. 

Mikäli tietoa tai tietolähdettä ei varmisteta, niin tekoäly tekee ennemmin tai myöhemmin virheitä. Eli tuo virhe on siinä, että kyseinen ohjelmisto lataa tietoa väärältä kotisivulta. Mikäli ajatellaan että tietokanta on nopea, niin silloin pitäisi kysyä suoraan, että miksi se on nopea? Jättääkö tietokanta tai sitä ohjaava algoritmi esimerkiksi kotisivujen vertailun tekemättä? Eli eikö se vertaa kotisivujen sisältöä muihin kotisivuihin, joiden aiheen pitäisi olla sama tuon käytettävän sivun aiheen kanssa? 

Kun puhutaan esimerkiksi Internetistä sekä sen sisältämästä tiedosta, niin tekoälyn antamat väärät vastaukset johtuvat siitä, että tekoäly valikoi tietoa kotisivuista, joiden sisältämä data vastaa sitä kuvausta, jonka tekoälyn käyttäjä on antanut. Siis väärän kotisivun valinta johtuu siitä, että sivu on näyttänyt joltain muulta. Ja tekoälyä voidaan huijata vaihtamalla kotisivujen sisältöä. Se mikä auttaisi tekoälyjä jäsentämään tietoa olisi se, että kotisivuilla olisi pakollinen hashtag, jolla kotisivun tekijä merkitsisi sen aiheen tai kategorian mitä kotisivu edustaa. Ja jos sitten sisältö poikkeaa annetusta aiheesta, niin kotisivu voidaan merkitä mahdollisesti virheelliseksi. 


https://fi.wikipedia.org/wiki/NoSQL


https://fi.wikipedia.org/wiki/Relaatiotietokanta


Ei kommentteja:

Lähetä kommentti

Huomaa: vain tämän blogin jäsen voi lisätä kommentin.

Ydinaseita ja miinasopimusta.

  Yllä: Panavia Tornado IDS  kylvää pommeja sekä miinoja JP233 yksiköstä  Syy Israelin iskuun Iraniin saattaa olla ainakin osittain Trumpin ...