Pēdējo mēnešu laikā ir novērota pastiprintāta interese par ChatGPT un citiem Lielajiem Valodu Modeļiem (Large Language Models (LLM)). Šīs modernās mašīnmācīšanās metodes izmanto apjomīgus tiešsaistes datus kopā ar modernākajiem neironu tīklu algoritmiem (Neural Network algorithms), rada mākslīgā intelekta asistentus, kuri spēj "sarunāties” ar lietotājiem šķietami normālā sarunā. Nav grūti iedomāties, ka šī jaunā un aizraujošā tehnoloģija var mainīt “spēles gaitu” produktivitātes un virtuālo asistentu jomā. Turpmāk šajā rakstā mēs aplūkosim ChatGPT pamatus un parādīsim, kāpēc tas varētu izmainīt darbu vairākās nozarēs un mainīt mūsu ierasto darbu gaitu.
Tā vietā, lai vienkārši sarunātos ar lietotājiem, kā to darītu parasts tērzēšanas robots, šie modeļi var izmantot savas plašās zināšanas (aptuveni 8 miljoni tīmekļa lapu plus papildu datu avoti), lai palīdzētu cilvēkiem atbildēt uz dažādiem jautājumiem, sākot no atsauču meklēšanas un atbildēšanas uz jautājumiem līdz pat satura sagatavošanai dažādiem projektiem, programmatūras kodēšanai un laikrakstiem.
ChatGPT un citi Lielie Valodu Modeļi ir izstrādāti, izmantojot statistikas tehnoloģijas (zināmas kā mašīnu dziļā mašīnmācīšanās (Deep Learning)), kas ļauj tiem apgūt vārdu nozīmes, savstarpējās vārdu attiecības un veidot sarežģītus jēdzienus. Tas nozīmē, ka tāds modelis var izmantot statistisko informāciju (vārdu biežumu un savstarpējo saikni teksta kontekstā), lai saprastu kontekstu un viegli atšķirtu divus vārda "zāle" lietojumus, pamatojoties uz teksta norādēm. Vēl svarīgāk ir tas, ka šādi modeļi spēj uzminēt, kādi vārdi vai teikumi varētu sekot sarunas gaitā vai rindkopā (līdzīgi tam, kā cilvēki saprot valodu). Pateicoties šai spējai, Lielie Valodu Modeļu principā var izmantot iegūto statistisko informāciju, lai, balstoties uz statistiskiem parametriem, veidotu jaunu saturu.[1]
Ikdienas lietotājam tas nozīmē to, ka ChatGPT var ne tikai atbildēt uz āķīgiem jautājumiem, bet arī izmantot tā kartētos valodas datus, lai palīdzētu uzrakstīt piedāvājumu nākamajam projektam vai pat palīdzētu sākt programmatūras kodēšanas projektu. Tam ir potenciāls palielināt produktivitāti, automatizēt atkārtotus uzdevumus un pat palīdzēt izpildīt radošus uzdevumus – veidot jaunu saturu.
Šī tehnoloģija pašlaik ir tik aktuāla, ka Google pietika tikai sniegt sava Google Bard LLM modeļa kļūdainu izvades fragmentu, un Google akciju vērtība piedzīvoja dziļu kritumu visas tās dienas garumā. Šobrīd ir pats labākais laiks izstrādāt LLM, ja var nodrošināt, ka tā sagatavotās atbildes ir pareizas. [2]
Ir vērts pieminēt, ka šī tehnoloģijas pašreizējā attīstības fāze nav bez trūkumiem, LLM un ChatGPT ir optimizēti tā, lai sagatavotu tekstu, kas skan ticami. Tas nozīmē, ka tie pēc saviem parametriem var necensties identificēt patiesību vai faktus, savukārt lai sagatavotu tekstu, kas skan ticami šie algoritmi var ciest no pārāk lielas pašpārliecinātības, izklausoties autoritatīvi rakstot atbildes. Lai arī "cilvēkam līdzīgs" un autoritatīvs runas veids padara LLM palīgprogrammas vieglāk saprotamas lietotājiem, tas nozīmē arī to, ka cilvēki var tos uztvert kā pārāk pārliecinošus, jo tie spēj izmantot mūsu standarta aizspriedumus komunikācijas jomā. [3]
Svarīgi ir neaizmirst arī to, ka jebkura MI modeļa liels trūkums var būt tā redzētie dati. Ja dati, uz kuru bāzes ir veikta modeļa apmācība, satur neobjektīvu un neprecīzu informāciju, šāda informācija pastāvēs arī apmācītajā valodas modelī un tiks sniegta tā sagatavotajās atbildēs. [4]
2023. gada martā OpenAI nāca klajā ar jaunu produktu – GPT-4. OpenAI vēl nav atklājis sīkāku informāciju par to, kā GPT-4 tika apmācīts. Runājot par iespējām, ChatGPT un GPT-4 ir vairāk līdzību, kā atšķirību. Atšķirībā no ChatGPT, ar ko var sazināties tikai ar tekstu, GPT-4 pieņem ievaddatnes, kas sastāv gan no attēliem, gan no teksta. GPT-4 uzrāda lābākus akadēmisko eksāmenu rezultātus kā lielākā daļa cilvēku, tai skaitā ASV vienoto advokātu eksāmenu (Uniformed Bar Exam) – GPT-4 ir Top 10%. GPT-4 ir arī drošāks, radošāks un precīzāks kā tā priekštecis ChatGPT, tomēr abiem šiem modeļiem ir būtiski ierobežojumi un riski.
Līdz ar veiktajām investīcijām Open AI Microsoft plāno plašāk integrēt LLM modeļus savos produktos. Nākotnē cilvēki aizvien vairāk saskarsies ar GPT-4 un citiem LLM modeļiem savos ikdienas darbos. Jau šobrīd ir zināms Microsoft nākamais produkts - Microsoft 365 Copilot, kas ļaus nemanāmi izmantot LLM modeļu priekšrocības mūsu ikdienas darbā .