Johta­misen ja esimiestyön erikoi­sam­mat­ti­lehti
suuret kielimallit

Suuret kielimallit ja niiden seuraavat askeleet

Tekoälyratkaisujen yleistyttyä olisi tärkeää pysähtyä pohtimaan sen tarjoamien mahdollisuuksien lisäksi myös tulevaisuuden näkymiä. Millaiseen suuntaan erilaiset tekoälyt ja suuret kielimallit ovat kehittymässä? Mihin oikeastaan olemme matkalla?

Generatiiviset tekoälyratkaisut kuten ChatGPT ja Claude näyttävät saavuttaneet jonkinlaisen, ainakin hetkellisen lakipisteen kuluttajien käytössä. Painopiste näyttääkin keskittyneen ammatilliselle puolelle, jossa yritykset enenevissä määrin pyrkivät hyödyntämään tekoälyn tuomia potentiaalisia tuottavuushyötyjä. Vaikka tiivis integrointi organisaatioiden prosesseihin on vielä poikkeus (vain viitisen prosenttia yrityksistä Yhdysvalloissa ilmoittaa ottaneensa tekoälyn tiiviiksi osaksi kaikkia prosessejaan) ovat yritykset selvästi heränneet kielimallien hyödyntämisen mahdollisuuksiin. Jos suuret kielimallit, tekoäly ja esimerkiksi ChatGPT vielä mietityttävät, käy lukemassa kirjoittamamme artikkeli aiheesta. Seuraavaksi kuvailen muutamia suuntia, joihin suuria kielimalleja on ryhdytty jo soveltamaan organisaatioissa.

RAG – Retrieval-Augmented Generation

RAG (Hakutoimintoja tukeva generointi) sovellutuksilla tarkoitetaan suurten kielimallien käyttämistä organisaatioiden sisäisten prosessien tukemiseen tiedonhaun näkökulmasta. Esimerkiksi yksi sovellutuskohde on organisaation sisäisten tiedostojen hakeminen puhekieleen perustuen. Tässä sovellutuksessa organisaation dokumentit (teksti tiedostot, excelit jne.) on jaettu pienempiin osiin ja kategorisoitu tietokantaan. Tämän jälkeen käytetään esimerkiksi GPT pohjaista kielimallia tiedonhakuun tuosta tietokannasta vaikkapa Slack (organisaatioiden sisäiseen viestintään suunnattu pikaviestintäohjelma) integraation avulla. Jos työntekijä huomaa tarvitsevansa jotain tiettyä tietoa sisältävän dokumentin, voi hän kuvailla asiaa Slackissa ja GPT hakee kuvailun perusteella ehdotuksia dokumenteista. Organisaation olemassa olevan datan hyödyntämistä pystytään tehostamaan merkittävästi, kun mahdollistetaan sen kanssa vuorovaikuttamista luonnollisen kielen kautta.

datan hyödyntäminen

STAG – Stream-Trigger Augmented Generation

RAG:in perustuessa organisaation jäsenten aktiivisuuteen datan kanssa vuorovaikuttamisessa, STAG (Datavirta aktivoituva tiedon generointi, vapaa suomennos) sovellutukset perustuvat organisaation tietojärjestelmien tuottaman jatkuvan datavirran proaktiiviseen läpikäyntiin ja tämän perusteella koosteiden, analyysien ja ilmoituksien yms. tuottamiseen. STAG sovellutuksessa organisaatio asettaa tiettyjä kysymyksiä, joita luonnollinen kielimalli (esim. GPT) esittää jatkuvasti päivittyvään tietokantaan. Esimerkiksi jos organisaation asiakaspalautteissa esiintyy tietty termi riittävän monta kertaa, tai kielimalli tunnistaa muutoksen asiakaspalautteiden trendeissä, ilmoittaa se tästä havainnosta asiakaspalvelutiimin sisäiseen keskustelukanavaan ja ehdottaa jatkotoimenpiteitä. Näin organisaatiot pystyvät valjastamaan suuret kielimallit oman datavirtansa proaktiiviseen ja jatkuvaan läpikäyntiin. Tämä mahdollistaa mm. nopeampaa reagointia muutoksiin tai tukee kehittämistoimenpiteitä.

datan käyttö

RAG ja STAG eivät toki ole toisiaan poissulkevia. Uskoisin, että organisaatiot päätyvät lähitulevaisuudessa käyttämään kumpaakin lähestymistapaa tukemaan toinen toisiaan. Esimerkiksi toistuvat RAG-tyyppiset kyselyt muodostavat datavirran, johon pystytään soveltamaan STAG-tyyppistä trendien löytämiseen tähtäävää kysymistä. Näin organisaation johdolle muodostuu parempi kuva siitä, mihin työntekijöiden tietotarpeet keskittyvät ja tämän pohjalta pystytään muotoilemaan prosesseja / käytänteitä / strategiaa. Toisinpäin sovellettuna STAG-ratkaisulla voidaan esimerkiksi kohdistaa jatkuvaa kyselyä organisaation tulovirtaan. STAG tuottaa tulovirtoihin ja mahdollisiin lähteiden painotusmuutoksiin perustuen analyysejä / havaintoja. Näihin liittyen voivat sitten johdon edustajat esittää luonnollisen kielen kautta RAG-tyyppisiä kysymyksiä – Miten dramaattinen muutos on verrattuna samaan ajankohtaan vuosi sitten?

Kielimallien trendi näyttäisi siis olevan suuremmasta kohti pienempää ja tiettyyn sovellutuskohteeseen erikoistuvaa. Tämä on ymmärrettävää myös siitä näkökulmasta, että suuremmissa kielimalleissa on aina riski myös mallin rikkoutumiselle. Aivan kuten tietokoneohjelmatkin, sisältävät suuret kielimallit bugeja ja inhimillistä erhettä. Mitä suurempi malli, sitä monimutkaisempi se on ja sitä alttiimpi se on virheille. Näin organisaatioiden näkökulmasta suureen kielimalliin nojaaminen kriittisissä prosesseissa voi olla merkittävä riski.

Kielimallit tarjoavat paljon mahdollisuuksia, mutta entä sitten mahdolliset vaikutukset yleisemmin digitaalisiin elämiimme?

Jos pimeään metsään haluat mennä nyt

Useat aikakautemme tunnetut astronomit ja tiedemiehet uskovat, että muodossa tai toisessa, maailmankaikkeudessamme esiintyy elämää muuallakin kuin maapallolla. SETI:llä työskenntellyt Frank Drake kehitti suhteellisen kuuluisan Draken kaavan, jonka avulla voidaan arvioida elämän esiintymisen todennäköisyyttä. Vaikka elämän esiintymiselle planeetoilla annettaisiin pienikin todennäköisyys, on planeettoja yksinkertaisesti niin paljon, että elämän esiintyminen muualla alkaakin näyttämään suhteellisen todennäköiseltä. Vaikka tämä onkin hieman kyseenalainen lähestymistapa arvioiden tekemiseen, sillä emme aidosti tiedä mikä oikeasti on elämän esiintymisen todennäköisyys missään muualla kuin maapallolla. Maapallon elämän syntymisen todennäköisyyksiä taas pystymme arvioimaan tasolla ”no näyttäisi siltä, että elämää on”. Tästä huolimatta tämä on silti hauska ajatusleikki.

Jos oletamme, että Drake on jonkun äärellä ja että elämän esiintyminen muualla on jopa todennäköistä, niin missä se kaikki elämä on? Miksemme ole nähneet todisteitä tästä parhaimmillaan (tai pahimmillaan) elämää kuhisevasta universumista? Tätä kysymystä pohti myös Enrico Fermi, jonka mukaan tämä näennäinen paradoksi on myös nimetty. Fermin paradoksiin on esitetty useita ratkaisuja, mutta suurten kielimallien tulevaisuuden näkökulmasta yksi mielenkiintoisimmista on Liu Cixin Kolmen Kappaleen Probleema tieteiskirjasarjassaan esittämä ”Pimeä metsä” ratkaisu. Pimeä metsä ratkaisussa Fermin paradoksia selitetään sillä, että universumistamme löytyvät sivilisaatiot pyrkivät kätkemään olemassaolonsa muilta sivilisaatioilta, sillä ne ovat nähtävissä todennäköisinä uhkina. Universumissa, jossa resurssit ovat rajallisia ja muut nähdään uhkina selviytymiselle, hiljaisuus tarkoittaa selviytymistä.

suuret kielimallit - pimeä metsä

Miten tämä nyt liittyy suuriin kielimalleihin? Suuret kielimallit ja yleisemmin generatiivinen tekoäly ovat tuoneet mukanaan valtavia muutoksia jo nyt. Joissain arvioissa on esitetty, että asiantuntija ryyditettynä generatiivisella tekoälyllä on 20% tuottavampi kuin asiantuntija ilman tätä työkalua. Lääketieteessä on ryhdytty hyödyntämään tekoälyratkaisuja sekä uusien lääkkeiden kehittämisen nopeuttamiseksi että uusien käyttötarkoitusten löytämiseksi nykyisille lääkkeille. Suurten kielimallien voidaan siis osoittaa omaavan merkittävää potentiaalia asioiden kehittymiseen positiiviseen suuntaan.

Toki, kuten kaikkia teknologioita, on myös tekoälyratkaisuja mahdollisuus käyttää ei niin rakentavassa hengessä. Mielestäni yksi suurimmista riskeistä generatiivisen tekoälyn näkökulmasta on tulevaisuus, jossa löydämme itsemme ”Pimeä metsä” internetistä. ChatGPT:n saavuttua, tekstin tuottaminen on lähtenyt räjähdysmäiseen kasvuun. Nykyisellään arvioidaan, että generatiivisen tekoälyn ansiosta tuotamme enemmän tekstiä, kuin kaikki ihmiskunnan historian aikana kirjoitetut kirjat yhteenlaskettuna, kahdessa viikossa. Ei ole siis kaukaa haettu ajatus, että internet, kuten me sen tällä hetkellä ymmärrämme, tulee lähitulevaisuudessa olemaan huomattavasti nykyistä keinotekoisempi. Emme enää kohta voi tietää, onko näppäimistön äärellä ihminen vai kone. Jo nyt todennäköisyydet ovat sen puolella, että kone sieltä löytyy. Näin se vähäinenkin inhimillinen kontakti, mitä nykyisellään internet on meille tarjonnut, poistuu kokonaan. Internetin käyttäjät vetäytyvät omiin kupliinsa suojaan boteilta, markkinoijilta, digitaalisilta trolleilta, huijareilta ja muilta tahoilta, jotka ovat automatisoituja ihmisten hyväksikäyttöön. Kuplassasi ainakin tiedät vuorovaikuttavasi ihmisen kanssa. Tervetuloa pimeään metsään.

Tommi Lindholm
Yritysvalmentaja
KTM Tommi Lindholm kouluttaa laajasti lähijohtamisen eri osa-alueita ja on erikoistunut tekoälysovellutusten hyödyntämiseen johtamistyössä. Teknologia on ollut aina lähellä Tommin sydäntä, mistä myös innostus tekoälyn kehityksen seurantaan on lähtenyt. Tommin kaiken valmentamisen taustalla vaikuttaa tutkijan syvällinen ymmärrys organisaatioiden toiminnasta ja ihmisten käyttäytymisestä.
Lue lisää
Ilmoittaudu koulutukseen
Hybridijohtaminen e-kirja
Kirjat
Hybridijohtaminen (e-kirja)
Lue lisää
Aiheesta lisää
ChatGPT – Mitä tekoäly, kielimallit ja ChatGPT tarkoittavat?
ChatGPT ja tekoäly ovat viimeisen vuoden aikana muuttaneet työelämää merkittävästi. Niistä puhutaan paljon, mutta tuntuu ettei niitä välttämättä avata tarpeeksi selvästi.
Lue artikkeli
tekoälyn vaikutus organisaatioihin
Miten tekoäly vaikuttaa organisaatioihin, johtamiseen ja asiantuntijuuteen?
Lue artikkeli