Od odporúčacích algoritmov Netflixu cez rozpoznávanie tváre v mobile až po medicínsky diagnostický softvér – strojové učenie preniklo do každodenného života. V článku ukazujeme, ako sa líši od klasického programovania, akým spôsobom sa počítače učia z dát, aké sú hlavné typy učenia a prečo sú kvalita dát aj zrozumiteľnosť dôležité ako samotná presnosť.
Umelá inteligencia je široký pojem, ale väčšina moderných systémov, ktoré označujeme ako AI, v skutočnosti využíva strojové učenie. Či už sledujete odporúčané filmy na Netflixe, komunikujete s chatbotom v e-shope, alebo vám telefón rozpozná tvár, za tým všetkým je algoritmus, ktorý sa učil z obrovského množstva dát. Ako vysvetľuje MIT Sloan, práve strojové učenie je dnes už kritickým spôsobom, ako sa väčšina AI systémov vyvíja.
Základná myšlienka je pritom relatívne jednoduchá. Namiesto toho, aby programátori počítaču presne povedali, čo má robiť, nechajú ho, aby sa to naučil sám z príkladov. To je zásadný rozdiel oproti klasickému programovaniu, kde sa každý krok musí ručne definovať. Pri strojovom učení je naopak cieľom vytvoriť model, ktorý sa dokáže prispôsobiť novým situáciám a rozhodovať na základe toho, čo už predtým videl.
Strojové učenie je teda skôr ako školenie zamestnanca než písanie návodu pre stroj. Nepíšeme konkrétne pravidlá, ale poskytujeme dáta a spätnú väzbu. Počítač potom skúša nájsť vlastné postupy, ako dôjsť k správnym výsledkom.
Každý systém strojového učenia začína pri dátach. Tými môže byť prakticky čokoľvek – texty, čísla, obrázky, zvuk, video, ale napríklad aj záznamy zo senzorov či transakcie z bankového účtu. Tieto dáta sa najprv spracujú do podoby, s ktorou môže algoritmus pracovať. Často je potrebné ich očistiť od chýb, zjednotiť formát alebo rozdeliť na jednotlivé časti. V tejto fáze sa tiež rozhoduje, ktoré dáta použijeme na trénovanie modelu a ktoré si ponecháme na neskoršie overenie výsledkov.
Nasleduje voľba vhodného modelu. To je vlastne matematický nástroj, ktorý sa bude na dátach učiť rozpoznávať vzory. Niekedy si vystačíme s jednoduchými štatistickými metódami, inokedy je potreba zložitejších neurónových sietí s mnohými vrstvami. V takom prípade hovoríme o hlbokom učení alebo deep learningu. Práve tento prístup stojí za väčšinou dnešných pokročilých AI systémov od autonónmych vozidiel až po generatívne modely typu ChatGPT. Model sa pri trénovaní učí „hádať“ správne odpovede na základe predchádzajúcich príkladov a postupne si ladí svoj vnútorný systém tak, aby sa v týchto odhadoch zlepšoval.
Počas trénovania sa teda stroj učí, ako z daných vstupov dôjsť k správnemu výstupu. Pokiaľ napríklad rozpoznáva zvieratá na fotografiách, na začiatku netuší, čo robí psa psom. Ale s každou ďalšou fotografiou, ktorú vidí, a so správnou odpoveďou, ktorú dostane, si upravuje vlastnú vnútornú predstavu o tom, čo je pre psa typické. Po niekoľkých tisícoch opakovaniach už dokáže rozpoznať psa aj na novej fotografii, ktorú doteraz nevidel.
Výsledný model potom testujeme na skôr nevidených dátach, aby sme zistili, ako dobre generalizuje. Pokiaľ dosahuje dostatočnú presnosť, môže byť nasadený do prevádzky, či už vo forme odporúčacieho algoritmu, diagnostického nástroja alebo napríklad riadenia robotického ramena vo výrobe.
Podľa toho, akým spôsobom s dátami pracujeme, rozlišujeme tri hlavné prístupy k strojovému učeniu.
Výpočet oblastí, kde strojové učenie nachádza využitie, je takmer nekonečný. V e-commerce odporúča produkty na základe predchádzajúceho správania zákazníkov. V zdravotníctve pomáha analyzovať snímky z magnetickej rezonancie alebo predpovedať riziko chorôb. V bankovníctve odhaľuje podvodné transakcie a hodnotí úverovú bonitu klientov. Vo výrobe predikuje poruchy strojov na základe dát zo senzorov a v podnikaní všeobecne dokáže vyhodnocovať a navrhovať marketingové stratégie podľa hospodárskych výsledkov.
V bežnom živote sa so strojovým učením stretávame napríklad pri používaní mobilných aplikácií, ktoré rozpoznávajú hlas alebo prekladajú cudzie jazyky, pri autonómnych vozidlách či na sociálnych sieťach, kde algoritmy rozhodujú, aké príspevky uvidíme. Pochopiteľne, aj najznámejší chatboti – ako ChatGPT, Gemini alebo Copilot – sú založení na strojovom učení a tréningu na miliardách vstupných dát.
Napriek tomu, že sú výsledky strojového učenia často pôsobivé, technológia má svoje limity. Model sa učí iba z toho, čo mu dáme. Pokiaľ sú dáta neúplné, skreslené alebo inak problematické, model môže preberať ľudské predsudky a reprodukovať ich. Známe sú prípady, keď algoritmus diskriminoval určité skupiny ľudí pri rozhodovaní o hypotékach, alebo uprednostňoval určité typy obsahu na základe náhodných korelácií.
Problémom je aj takzvaná neinterpretovateľnosť modelu. Pri zložitejších systémoch, ako sú hlboké neurónové siete, je náročné určiť, prečo model dospel k určitému záveru. To je citlivé najmú v oblastiach, kde je potrebné vedieť rozhodnutie spätne vysvetliť, ako napríklad v medicíne alebo v súdnom systéme.
Ďalšou slabinou je náchylnosť na manipuláciu. Stačí drobná zmena v dátach a model môže urobiť zásadnú chybu. Napríklad algoritmus, ktorý mal rozpoznávať psy a mačky, označil psa za pštrosa len preto, že niekto upravil metadáta fotografie.
V neposlednom rade platí, že nie každý problém je vhodný na strojové učenie. V mnohých firmách panuje tendencia nasadzovať AI tam, kde by postačil jednoduchý skript alebo ľudské rozhodnutie. Odborníci preto často odporúčajú začínať pri probléme, nie pri technológii. Najprv je potrebné vedieť, čo chceme riešiť, a až potom zvažovať, či je strojové učenie tým správnym riešením.
i
Mohlo by vás zaujímať
Strojové učenie je výkonný nástroj, ktorý umožňuje počítačom učiť sa z dát, hľadať vzory a robiť rozhodnutia bez explicitného programovania. Má obrovský potenciál zlepšiť efektivitu, kvalitu služieb a schopnosť prispôsobiť sa potrebám používateľov. Zároveň však prináša nové riziká – od predsudkov až po nesprávne interpretácie výsledkov. Preto je dôležité chápať nielen to, čo strojové učenie dokáže, ale aj to, čo nedokáže. A ak sa niekedy stretnete s tým, že vám AI niečo dôležité odporúča, zamyslite sa, z akých dát asi vychádza. Niekedy to bude fungovať skvele. A inokedy vám ponúkne čokoládovú tortu s kuracím mäsom – presne ako v jednom slávnom experimente s generovaním receptov.