Kauno technologijos universitetas (KTU) kviečia į jau tradicija tapusį renginį, kurio dalyviai gegužės mėnesį galės išgirsti apie naujausias didžiųjų duomenų ir dirbtinio intelekto (DI) tendencijas iš Europos, Lietuvos mokslininkų. Savo patirtimi dalinsis ir verslo bei viešojo sektoriaus atstovai.
Milijardai žmonių pasaulyje turi prieigą prie interneto. Kiekvienas veiksmas, kurį jie atlieka internete, generuoja naujus duomenis. Įvairios pramonės šakos ir verslai naudoja šiuos duomenis klientų informacijai rinkti, stebėsenai, žmogiškiesiems ištekliams valdyti ir kt. Didžiųjų duomenų sąvoka nėra jokia naujiena.
Tačiau nauja arba bent jau vis dar plėtojama yra tai, kiek duomenų inžinieriai gali valdyti, duomenų mokslininkai gali eksperimentuoti, o duomenų analitikai gali analizuoti šį neapdorotų verslo įžvalgų lobyną.
Kitaip tariant, didieji duomenys (angl. big data) yra visų procesų ir įrankių, susijusių su didelių duomenų rinkinių naudojimu ir valdymu, derinys. Didžiųjų duomenų koncepcija gimė iš poreikio suprasti tendencijas, pageidavimus ir modelius didžiulėje duomenų bazėje, kuri sukuriama žmonėms sąveikaujant su skirtingomis sistemomis.
Sukuria pranašumą versle
Naudodamos didžiuosius duomenis verslo organizacijos gali naudoti analizę ir išsiaiškinti vertingiausius klientus. Tai taip pat gali padėti įmonėms sukurti naują patirtį, paslaugas ir produktus.
Pasak KTU Matematikos ir gamtos mokslų fakulteto (KTU MGMF) docento ir „KTU Big Data School“ vadovo dr. Tomo Iešmanto, didžiųjų duomenų naudojimas leidžia įmonėms būti priekyje kitų: „Daugelyje pramonės šakų nauji rinkos dalyviai ir įsitvirtinę konkurentai naudoja duomenimis pagrįstas strategijas, siekdami konkuruoti ir kurti naujoves. Tiesą sakant, didžiųjų duomenų naudojimo pavyzdžių galite rasti beveik visuose sektoriuose – nuo IT iki sveikatos priežiūros įstaigų ir bankų.“
Lietuvos Banko atstovės Viktorija Lukaševičiūtė ir Viktorija Grybauskaitė teigia, kad bankai visada buvo priklausomi nuo duomenų: „Visi centrinių bankininkų sprendimai visada buvo pagrįsti duomenimis. Tačiau šiais laikais situacija keičiasi – neužtenka turėti hipotezę ir ją patvirtinti duomenimis“.
Įrankiai neatsiejami nuo didžiųjų duomenų
Jų teigimu, būtina orientuotis į duomenis ir įgalinti jais pagrįstą sprendimų priėmimą, t. y. ginčytis duomenimis, kad iš jų būtų galima išgauti arba nubrėžti modelius ir generuoti įžvalgas, neturint iš anksto nustatytos hipotezės arba nesinaudojant istorine patirtimi.
„Nenuostabu, kad centriniai bankai siekia gauti daugiau mikro lygio duomenų, o šie nauji didžiųjų duomenų šaltiniai yra naudojami siekiant atlikti tikslesnę finansinio stabilumo analizę ir skatinti geresnį rizikos mažinimą, remiantis duomenimis pagrįstomis namų ūkių skolinimo tendencijomis,“ – teigia šių metų „KTU Big Data School“ pranešėjos.
KTU MGMF docentas dr. Mindaugas Kavaliauskas teigia, kad didieji duomenys padeda ne tik analizuoti ir prognozuoti įvairius procesus, bet ir padeda kurti naujus įrankius, tokius kaip „ChatGPT“: „ChatGPT“ yra pažangiausias pokalbių robotas, kurį sukūrė „OpenAI“. Jis sukurtas naudojant „Generative Pre-Tained Transformer“ (GPT) architektūrą, ypač GTP-3.5 modelį su pritaikytu koregavimu. Nors tikslus modeliui parengti panaudotų duomenų kiekis neatskleidžiamas“.
Mokslininko teigimu, apskaičiuota, kad jame yra šimtai milijardų žodžių, o mokymo procese buvo panaudota 10 000 GPU ir 285 000 procesoriaus branduolių.
„Tai dideli duomenys. „ChatGPT“ pateko į antraštes dėl teisinių, autorystės ir etinių priežasčių, susijusių su tokių pažangių technologijų naudojimu, ir baimės dėl darbo perkėlimo ateityje. Nors šiuo metu tai yra pagrindinis pokalbių robotas, „Google“ paskelbė „Bard“, o „Microsoft“ paleido „Bing Chat“. Varžybos tik prasideda“, – teigia M. Kavaliauskas.
Supažindins su naujausiomis tendencijomis
Visos naujausios ir aktualiausios didžiųjų duomenų tendencijos bus nagrinėjama šių metų „KTU Big Data School“. Teorines ir praktines sesijas ves bei savo patirtimi dalinsis lektoriai, aktyviai vykdantys tyrimus didžiųjų duomenų analizės ir apdorojimo srityse – tai dr. Michael Fairbank (Ekekso universitetas, Jungtinė Karalystė), dr. Wannes Meert (KU Leuven universitetas, Belgija), dr. Mindaugas Kavaliauskas (KTU MGMF, Lietuva).
Šiais metais gegužės 3–5 dienomis vyksiančioje „KTU Big Data School“ programoje laukia naujovė: įmonių atstovų pranešimai apie didžiųjų duomenų taikymą praktinėje srityje. Šiais metais pranšimus skaitys Agnė Reklaitė („Vinted“), Edita Lukaševičiūtė ir Viktorija Grybauskaitė („Lietuvos Bankas“). Daugiau informacijos apie renginį: https://bigdataschool.ktu.edu/