Viimaste puhul toob KPMG Balticsi tehnoloogiavaldkonna juht Tarmo Toiger näiteks andmete sisestamise ja liigutamise ning müügis ja turunduses baastekstide koostamise. Täna võiks seda kontrollitult teha juba robot, sest see on koht, kus on võimalik organisatsiooni efektiivsust hüppeliselt tõsta, kinnitab ta.
Vastab KPMG Balticsi tehnoloogiavaldkonna juht Tarmo Toiger:
Milline on meie senine kokkupuude tehisintellektiga?
Statistiline analüüs arvutite abil algas 30-40 aastat tagasi, kui arvutid said piisavalt võimsaks. Paarkümmend aastat tagasi nimetati seda masinõppeks, kuigi matemaatika seal taga oli täpselt sama. Ja nüüd me nimetame seda tehisintellektiks.
Jah, meil on olemas mõned spetsiifilised valdkonnad, milles tehisintellekti on kasutatud, kuid kasutusjuhud on seni olnud siiski väga piiratud. Kui mõtleme LLMi ehk suurte keelemudelite peale, siis seal on teatud nišid, kus tehisintellekt on nüüd tõesti fantastiline. Ja saame rääkida uutest kasutusjuhtudest. Samas need vanad, väga head statistilised ennustavad mudelid on täna alakasutatud, ent kõige suurema väärtusloomega.
Olen ise olnud aastaid ka Ameerikas teatud mudelite juurutamise juures. Juba üle 20 aasta tagasi suur kaubanduskett Macy´s suutis reaalajas muuta kauplustes hindu, et optimeerida oma ladu. Teades, et neil on vaja teha kampaaniat ning kaup ladudes ootamas, vaatasid nad, milline on prognoositav kliendikogus ja -maht poodides. Samuti võtsid nad arvesse muid näitajaid, näiteks kas oli vihmane või päikseline ilm.
Või teine näide: masinõpe, mida täna nimetatakse AI-ks, tegi juba ammu otsuseid, kas mingi krediitkaarditehing tuleb ära blokeerida või saata inimesele auditeerida. Seda otsust tegi ennustav mudel kümnete andmepunktide alusel, aidates vältida krediitkaardipettusi.
Need mudelid on loodud üle 20 aasta tagasi ülimalt efektiivselt, omades ettevõtetele väga suurt rahalist mõju. Pankadele pole see uus teema, jaekaubanduse sektoris Eestis samas on paljud neist asjadest väga uued.
Näiteks allahindluste optimeerimine on masinõppe mudelit kasutades vaid kolmekuulise return-on-investment´iga [investeeringu tootlus]. Otsi mingi muu tehnoloogiline lahendus, mille ROI oleks kolm kuud, ei tule pähe! Teisisõnu räägime nagu vanadest asjadest uuesti. Tõsi, suurtel keelemudelitel on teistsugused kasutusjuhud.
Mida kliendid teilt küsivad, kui nad soovivad nõu AI osas?
Soovivad vähendada tööjõukulu ja personali arvu teatud protsessides. Näiteks finants-, müügi- või laonduse funktsioonis. Täna saab lihtsamate robotitega automatiseerida teatud tüütuid tegevusi ja seda kõike madala hinnaga.
Arvutitehnoloogia annab võimaluse automatiseerimiseks, teatud juhtudel ka otsuste automatiseerimiseks, näiteks see krediitkaardipettuste teema. Kui seal on väga kindel signaal, siis see ei peagi inimese käest läbi minema, vaid kaart suletakse hetkega. Seega otsus tehakse tehisintellekti poolt, kui teda võib nii nimetada.
Ettevõtete suurus määrab väga palju. Me oleme Eestis faasis, kus meil on vähe suurettevõtteid, see-eest on palju väikeseid ja keskmise suurusega ettevõtteid. Viimaste võimekus rakendada selliseid uusi tehnoloogiaid on kahetsusväärselt madal. Aga on ka erandeid. Väga suurt kasu annab logistika ja ladude optimeerimine.
Kui aga keegi küsib meilt, mida me müüme, siis tegelikult sa müüd tulemust. Me ei müü analüütikat, see on liiga abstraktne, sa müüd lahendust mingile probleemile. Näiteks kui mu varud on konstantselt liiga suured võrreldes konkurentidega. Siis ongi küsimus, kuidas seda varude juhtimist teha omale optimaalsemaks, et raha ei oleks nii palju kauba all kinni.
Millest peaks üks ärijuht või omanik alustama tehisaru kasutuselevõtul?
Alustama peaks küsimusest, et kui head nad on oma sektoris. Seega vastama küsimusele, kas meil on mahajäämus võrreldes näiteks rahvusvaheliste konkurentidega.
Eesti keskmine kasumimarginaal on ärikasumi ehk EBITA tasemel kaks-kolm protsendipunkti madalam kui Põhjamaades. Põhjusteks on ühelt poolt ettevõtete suurus ning ka ligipääs kõrgema hinda maksvate klientide juurde. Aga teiselt poolt ka üldine juhtimiskvaliteet.
Seda võib lahti mõtestada erineval moel, millest üks on automatiseerimine. Teine osa on see, et me võib-olla tegelemegi valede klientidega, kes maksavadki vähe.
Vastus küsimusele on see, et uue teadmise allikaks on võrdlus. Ärijuhina pean olema suuteline end võrdlema mitte ainult Eesti ettevõtetega, vaid ka rahvusvaheliste ettevõtetega, kes suure tõenäosusega on kõrgema marginaaliga. Ja siit tekib küsimus, et miks nad on kõrgema marginaaliga.
Näiteks oleme KPMGs tegelenud Eesti jaekaubanduse ettevõtetega. Nende EBITA marginaal on 2-3 protsendipunkti madalam kui Soomes. Tõsi, Soomes on oligopoolne, väga konsolideeritud turg.
Aga rääkides analüütikast, Keskol on Soomes kümmekond PhD tasemel andmeanalüütikut tööl, kes aitavad optimeerida nii hinnastamist, ladu, poodide asukohti, personalihulka ajaühikus ja muid küsimusi. Eesmärk on saada suhteliselt kallist ressursist, mis jaekaubanduses on nii pind kui ka personal, maksimum kätte.
Kui palju on doktorikraadiga andmeanalüütikuid Selveris, Coopis, Rimis? Sealt hakkab ka erinevus kooruma, juht peab ise nägema vajadust läbi sellise võrdluse välismaiste ettevõtetega.
Rääkisime, et AI on mitukümmend aastat vana, küll ümber nimetatud. Kui palju on seal n-ö halle tsoone või reguleerimata valdkondi?
Mingil määral on küll. Me isegi oma müügitegevuses kasutame väljendit AI in Control ehk et AI oleks kontrollitav. Ma pigem arvan, et Eestis on halli ala vähe, kuna üldine andmeanalüütika rakendamise maht on madal ja n-ö valmidus seda kasutada on samuti suhteliselt madal.
Tarbijana oleme seda näinud hallis alas, kus AI pannakse tegema teatud otsuseid, mis meile ei meeldi ja mis tehakse väga vähese info või vale info pealt. Näiteks Facebook võtab maha mingeid meie postitusi või pilte. Nende mudel on treenitud teatud andmete põhjal tegema mingeid otsuseid, aga seal on vead. Need vead omakorda jõuavad tarbijani välja.
Võtame kasvõi meedias palju kajastatud Planet42 juhtumi, ka nemad piloteerisid krediidiotsuseid läbi masinõppe mudelite. Need on piiripealsed küsimused, probleem või hall ala hakkab treeningandmetest peale. Kui sul on vigased treeningandmed, siis sa saad ka väga palju vigaseid vastuseid. Facebook on üks näide, krediidiotsused võivad olla teised näited. Me ei tea, mis mudelid on ettevõtetel kasutusel, et teha otsuseid.
Aastaid tagasi me ühe telekomiga realiseerisime ära, et kui müügiinimene soovis konkreetsele kliendile pakkuda lisatooteid, nägi ta ekraanil selle kliendi potentsiaalset kasumlikkust. Täpsemalt, milline on selle kliendi kasumlikkus ettevõttele ja kui palju me võime talle juurde müüa või allahindlust teha, et see kasumlikkus ei kukuks. See on ka Euroopa Liidus rakendatava AI akti üks vektoreid, mida püütakse reguleerida. Ehk kas see otsus on õiglane, mis mahus sellele kliendile allahindlust teha, pakkudes näiteks interneti- või telefoniühendust.
Selgelt on Euroopa Liit siin pioneer, jookseb Aasiast ja Ameerikast eest ära, mis puudutab AI regulatsiooni. Me võime vaielda, kas see on hea või halb, aga teised hakkavad Euroopa regulatsiooni järgima.
Sama oli andmekaitse koha pealt, kus ettevõtted väljaspoolt Euroopat hakkasid seda üle võtma. Ettevõtted on ju globaalsed. Kui sa kord juba oled Euroopas, siis suure tõenäosusega realiseeritakse samad reeglid ka Aasias ja Ameerikas. AIga juhtub sarnane lugu.
Kas regulatsiooni teema on AI alal olnud probleem?
Probleem on olnud see, et enamike neurovõrkudel olevate mudelite – nendeks on ka LLMid ehk suured keelemudelid – kohta väidetakse, et need on nagu mustad kastid ja me ei saa neist aru. Tegelikult on teadus nii palju edasi liikunud, et need on auditeeritavad ning mudeli tehtavad otsused on samuti auditeeritavad.
Varem käis suur vaidlus, et kas neid mudeleid saab üldse kasutada, kui me ei tea, kuidas otsus tekib. Nüüd on teadus edasi arenenud ja need saab n-ö ära tükeldada. Mulle sattus hiljuti kätte kaks teadusartiklit, mille kohaselt on auditeerimise alal tehtud teaduses oluline hüpe.
Mullu sügisel kinnitas KPMG, et kõrgete riskide tõttu ei sobi ChatGPT ärikasutuseks. Kas äsja käsitletud muudatuste tõttu on ChatGPT nüüd n-ö kasutuskõlblikum?
Jah, on, oluliselt. Me ise oleme ka võtnud kasutusele litsentseeritud GPT-lahendused, millel on teine privaatsus ja äritingimused kui tasuta ChatGPT. Need on kõigile kättesaadavad, kuigi teatud piirangutega.
Olemuslik probleem on vastustes. See, et me kasutame GPTd esialgse teksti koostamiseks, pole probleem. Ent faktilise info esitamises – versus näiteks Google Search – jääb GPT alati jänni. Ta võib treeningandmete põhjal anda meile valesid vastuseid, mistõttu meie LLM-ide kasutus ei ole nii lihtsakoeline, et laseme tal meie jaoks tekst kokku panna
Inimeste instrueerimise abil oleme jõudnud faasi, kus oleme julgenud selle oma inimestele kättesaadavaks teha. Meie saame sellest väga palju abi. Näiteks saame tõlkekulusid sellega vähendada, saame kliendile pakkuda palju kvaliteetsemat teksti ning palju kiiremini. Aga väga oluline osa on siiski toimetamisel, inimest ei saa protsessist välja võtta.
Tõlke puhul võin ma keelemudelit võõrkeele baastasemel suhteliselt pimesi kasutada, sest ma ei oska hinnata, kui palju vigu ta teeb. Kui aga oled kõrgtasemel keelekasutaja, siis märkad palju vigu ja neid tuleb korrigeerida.
Teine asi on otsing, mis on täna veel katastroofiline. See mudel ei ole otsimiseks sobiv, ma olen testinud seda mitmete keelemudelite põhjal, et ole hea ja otsi Tarmo Toigerit. Ja mida ta siis teinud on? Sealt tulevad fantastiliselt huvitavad vastused. Ma ei ole kunagi neid asju teinud, mida otsing välja toob, aga need kõlavad nii hästi…
Millega saab KPMG aidata asutusel või ettevõttel sisse seada turvalist ja juhitavat generatiivset võimekust?
Kõige kiiremini raha tagasi toovad lahendused on need, kus sa suunad oma tähelepanu rutiinidele, mida inimesed teevad käsitsi. Näiteks sisestades andmeid, liigutades andmeid, koostades baastekste müügis või turunduses jne. Aga ka süsteemide vahelised liigutamised: lao- ja müügiinimesed, müügi- ja turundusinimesed, finants, raamatupidamine ja müük. Nad liigutavad päris palju infot süsteemide vahel käsitsi, täna võiks seda juba teha robot, küll kontrollitult. See on koht, kus on võimalik organisatsiooni efektiivsust hüppeliselt tõsta.
Teine on loomulikult riigi pool. Eesti riik juurutab vaikselt kratte, mis on väga positiivne. Ent krattide juurutamiseks on vaja andmeanalüütikuid ja neid on meil lihtsalt vähe. Oleme liiga väike riik ja ses osas jääb võimekust puudu.
Milline see koostöö teie ja kliendi vahel välja näeb AI juurutamises? Mis on teie roll ja mida peab panustama klient?
Meie esimene roll on hinnata potentsiaali, leida kõige suurema kasuga protsessid, kus me hoiame töötunde ja mingeid tegevusi kokku. Siis laseme kliendil valida, mis on neist 10st või 20st kõige suurema potentsiaaliga, mis annavad kasu. Need siis püüame ära automatiseerida, mis lõpuks sõelale jäävad.
Mõte on ju kasutada tehnoloogiat just seal, kus on sellest kõige rohkem kasu. Näiteks kui räägime lihtsatest kontorirobotitest, kontori AIst, siis seal on realisatsiooni aeg kaks-kolm nädalat, ning ta on juba üleval ja töös. Need on väga kiired.
Kui räägime keerulisematest, statistilistest mudelitest, siis need vajavad oluliselt rohkem ettevalmistust. Kõigepealt on seal vaja leida andmeid, mis kirjeldavad olukorda kõige paremini. Ehk siis sama lugu: meil on vaja treeningandmeid, meil on vaja selgitada välja, milliste andmepunktide abil oleme suutelised seda mudelit üles ehitama. Samuti peab seda ka testima. Seal me räägime pigem kuudest kui nädalatest.
Aga kasu on võimalik lihtsast andmeanalüütikast ja robotitest saada täna väga kiiresti. Küsimus on tahtmises, vajadus on alati olemas.
Kuidas hallata AI kasutuselevõtu protsessi, kuna AI muutub-areneb nii kiirelt?
See puudutab rohkem keelemudeleid, vähem muid algoritme, mida kasutatakse optimeerimiseks. Kuna tähelepanu ja investeeringud on keelemudelite osas olnud viimastel aastatel väga suured, siis tõesti kuu või paariga on toimunud hüppelisi tõuse. Aga see nüüd pidurdub.
Mis puudutab muid statistilisi mudeleid, siis seal ei ole olnud nii kiireid arenguid. Täna kättesaadav matemaatika on ikkagi 1960ndatest, küsimus on selles, et me ei kasuta seda.
Suurte keelemudelite areng pigem ei ole edaspidi enam sama kiire, teatud hetkel peaks see stabiliseeruma. Keelemudel tuleb kasutusele näiteks kontoriabilistena, mis keele abil annavad sulle nõu, lahendades probleeme klienditeeninduses või müügis, või genereerivad teksti. Mida suuremad on andmemassiivid, seda paremaks ta läheb.
Täna näiteks tõlge võrreldes aastatagusega on nagu öö ja päev. Ka suhteliselt eksootiliste keelte tõlge. Kui ettevõtja täna mõtleb, et kasutan arvutit tõlke tarbeks, siis suure tõenäosusega tulevad lähiajal välja lihtsad kõrva pandavad abilised, mis kuulevad võõrkeelset teksti ja tõlgivad sulle seda. Prototüübid on olemas.
Mis puudutab muid mudeleid, siis areng on olnud suhteliselt stabiilne, mitte nii hüppeline. Pigem on kasvanud arvutusvõimsus ja andmemahtude rakendamise võimsus tänu sellele, et saame kasutada pilve.
Kas teie kliendikogemustest tuleb välja õiguslikke riske ja mis on neist suurimad?
Kõige olulisemad on valeotsused. Ma jätan kõrvale isesõitvad autod ja muud, mis on n-ö rasked probleemid. Kui räägime lihtsatest probleemidest nagu kas ma annan laenu või kas ma luban midagi publitseerida, siis see otsuse auditeerimine on vast kõige suurem mure.
Ja mida rohkem see laiemasse kasutusse läheb, seda enam võib ka sarnaseid probleeme tekkida. Kasvõi see, et me ei loe läbi ega toimeta piisavalt tekste, mis lähevad kliendile välja ja annavad võimaluse mingiteks otsusteks kliendi poole pealt. Seal kindlasti tekivad õiguslikud vaidlused.
Seda saab vältida nii, et sul on vahepeal ikkagi toimetaja funktsioon. Või siis jäigemad reeglid selleks, et kui inimest vahel pole, siis mis tingimustele peab produtseeritud tekst vastama. Kuid ennustan, et seal saab olema palju huvitavat kohtupraktikat.
Selliseid probleeme on maailmas juba olnud näiteks lennunduses ja kindlustuses, kus ilma piisavalt testimata on teatud asju juba kasutama hakatud, mis võtavad ettevõttele kohustuse. Sellega aga ongi sul ka kuri karjas.
Kui olulised on tehisaru rakendaja jaoks privaatsuse ja autoriõiguste küsimused?
Need on muidugi olulised. See on väga õiguslik ja spetsiifiline valdkond. Mõtlen, et kui meile antakse mingi mudel n-ö pihku, siis kes on see meeskond, kes sellele mudelile otsa vaatab? Meil on vaja minimaalselt kolme rolli: mudelit analüüsiv andmeanalüütik, isikuandmete spetsialist ja advokaat, kes vaatab seda puhtalt õiguslikust aspektist. Nemad peavad mudelile otsa vaatama, et kas ta teeb seda, mida on lubatud, et ta teeb. Ja mil moel ta neid otsuseid teeb. Spetsiifika on muidugi iga mudeli puhul erinev.
Kui suured muutused ootavad lähiajal tehisintellekti tõttu ettevõtlust ees?
Väga suurt muutust ei saa juhtuda. LLMil on teatud piirangud, me ülehindame seda. Keelemudelid on varana puhas haip, sellel ei ole ratsionaalset põhjendust ka nende ettevõtete väärtuse hindamisel. Valuatsioon on liialt kõrge, arvestades nende tegelikku potentsiaali, ja küll need alla tulevad. Tore on see, et sellega tegeletakse, on leitud uus viis väärtusloomeks. Aga see väärtusloome on kindlasti üle hinnatud.
Olen rääkinud meie andmeanalüütika korüfeedega ka teaduse poole peal. Nende kinnitus on see, et täna ei ole universaalse AGI ehk üldise tehisintellekti matemaatikat veel loodud. Oleme veel väga-väga kaugel, et me suudaks inimest asendada. Küll on kitsaid funktsioone, mida suudame sellega teostada. See teeb palju vigu, ei ole perfektne, aga sel ometi on mingi mõju.
Suurem mõju on varase staadiumi masinõppe statistilistel mudelitel, mis aitavad optimeerida erinevaid küsimusi. Nende paremal rakendamisel on suurem mõju kui keelemudelite rakendamisel. See on see, mis annab ettevõtetele rohkem rahalist kasu.
Kas võrdlus interneti tuleku mõjuga ettevõtlusele ei ole veel kohane AI mõju kontekstis?
Ei ole tõesti veel kohane. Tänast keelemudelite põhist haipi on üle hinnatud. Haibi definitsioon ongi ju ülehinnatud mõjus. Ja keelemudelite mõju on hetkel kindlasti üle hinnatud. Teisalt, kes seda tulevikku ikka ette näeb? Me ei tea, mida laborites tehakse. Tunnetus on hetkel siiski selline, et teadus pole veel seal, et järgmist väga kiiret hüpet ennustada.
Ent kuidas siis täpsust parandada ja AI väärtust suurendada?
Keelemudelite täpsuse suurendamine sõltub paljuski treeningandmetest. Kui andmed on väga hästi kontrollitud, siis on võimalik täpsust ka tõsta, faktivigu vältida. Aga olemuslikult see, kuidas keelemudel on üles ehitatud, seal on tendents genereerida teksti suhteliselt suvaliselt, arvestades treeningandmetes ette antud struktuuri.
Ega keelemudel ei tea sõnade tähendusest mitte midagi. Ta oskab neid järjestada vastavalt sellele, kuidas mudel statistilise tõenäosusega neid ette annab – kuidas inimesed on seda varasemalt kirjutanud.
Seda mudelit saab manipuleerida läbi treeningandmete manipulatsiooni: milliseid treeningandmeid me sinna ette anname. Saadakse ju ülimalt häid tulemusi kitsastes mudelitest. Näiteks erinevate eksamite tegemine. Kui see mudel kasutab sisendiks teatud tüüpi treeningandmeid, saavutab ta enamasti väga kõrge tulemuse. Aga seda ju pole, et ta millestki ka aru saaks. Ta annab lihtsalt selle testi kohaselt õigeid vastuseid.
Sa aga ei saa saata teda näiteks kohtusse, et ta oleks sinu advokaat. Siis ta jääb seal väga jänni, kuna tal puudub võimekus mõista sõnade tähendust.
Intellektini on tehisintellektil veel natuke minna?
Tegelikult väga palju! Tavapublik ei taju seda. See, et ta sulle esmapilgul inimese moodi teksti tagasi põrgatab ja tundub, et ta mõtleb, siis mõttetegevust seal ei ole. Vähemalt nii, nagu meie seda mõistame. Ta lihtsalt genereerib sulle enam-vähem loogilises järjestuses sõnu, ei muud.
Treeningandmete kvaliteet on niisiis üks kõige suuremaid riskikohti tehisaru kasutusele võtmises?
Jah, kindlasti. Kui mõtleme, et täna võib juhtuda see, mis on väga negatiivne ehk vaid suured liiguvad edasi nende keelemudelitega, siis põhjusel, et neil on ligipääs väga suurte mahtudega andmetele.
Näiteks kui sa püüad panna püsti iduettevõtet ja rakendada sama tehnoloogiat, ent sul puudub ligipääs treeningandmetele, ei jõua sa mitte kuhugi. Arvestades neid mudeleid ja seda tehnoloogiat, mida me kasutame. Treeningandmed on siin kõigi asjade võti.
See puudutab ka näiteks isesõitvaid autosid, kuid seal on probleeme veelgi. Küsimus pole autode treeningandmetes, vaid küsimus on ka mitmetes sensorites, mis annavad sulle valevastuseid ja häireid.
Eestis ei ole maailma mastaabis väga suuri ettevõtteid. Teisalt ei ole tehisintellekt asi, mis on kasulik vaid suurtele. Võid olla väiksem Eesti ettevõte, kes rakendab oma nišivaldkonnas tehisintellekti ja saab selle kasu ka kohe kätte? See julgustab ka väiksemaid ettevõtteid mõtlema tehisaru kasutamise peale.
Jah, absoluutselt. Ent küsimus on, et millisest tehisintellektist me räägime. Kui tahame näiteks tehisintellekti või masinõpet kasutada selleks, et vähendada oma laokulu – kui palju meil igal ajahetkel istub laos kaupa –, siis need on meie enda andmed. Saame võtta viimase kolme aasta lao liikumised, kõik tehingud, rikastada andmeid seeläbi, et milline on olnud ilm, mida on teinud konkurendid, mis kampaaniaid on tehtud jne. See andmestik on meie kontrolli all ja meie oma. Seetõttu saame meie ka maksimaalse kasu.
Keelemudelite puhul on keerulisem. Seal tuleb mängu see teema, mida ka enne käsitlesime, ehk isikuandmed ja autoriõigustega kaetud tekstid. Sellele ligipääsu ei pruugi kõigil olla. Ja kellel on, nemad on n-ö või sees ja suudavad mudelit vastavalt sellele lihvida.
Aga võtame sellise näite, et meil on telefonikeskus, kus salvestame kõnesid, saame neid ju transkribeerida ja tekib tekst. Siis on see meie isiklik andmestik, mida kasutades saame genereerida mõistuslikke vastuseid tehisintellekti abil. Selleks pole vaja kolmanda osapoole andmestikku. Ent see nõuab lihtsalt ettevalmistust.