Hlboké učenie umožňuje riešiť zložité problémy vďaka zostaveniu siete mnohých malých matematických funkcií známych ako umelé neuróny. Poďme si vysvetliť, ako to celé funguje.
Perceptron
Začnime štúdiom minimalistickej siete zloženej z jediného neurónu: perceptronu. Predstavme si, že chceme predpovedať kvalitu vína z určitého vinárstva. Máme k dispozícii 3 premenné:
- počet hodín slnečného svitu (x₁),
- množstvo zrážok (x₂),
- tepelnú amplitúdu (x₃).
Tieto údaje predstavujú vstupy do neurónu, ktorý na výstupe poskytne odhad y prostredníctvom váženého súčtu týchto údajov. Váhy (w) vyjadrujú dôležitosť jednotlivých vstupov. Napríklad slnečný svit má na kvalitu vína rozhodujúci vplyv. Ak výsledok prekročí stanovenú prahovú hodnotu, kvalita vína sa považuje za vysokú: výstup bude 1 a neurón bude aktivovaný. Ak je výsledok pod prahom, výstup bude 0 a neurón zostane neaktívny.
Princíp neurónovej siete
Pri zložitejších problémoch, ako je analýza obrazov, potrebujeme viac neurónov usporiadaných do vrstiev. Pozrime sa na túto sieť:
- Vstupná vrstva (vľavo) obsahuje neuróny, ktoré prijímajú údaje.
- Výstupná vrstva (vpravo) poskytuje výsledok.
- Medzi nimi sú tzv. skryté vrstvy, kde sa spracovávajú údaje.
Princíp fungovania je podobný perceptronu: ak je neurón a aktivovaný, odošle informáciu (hodnotu 1) ďalšiemu neurónu, ktorý ju spracuje spolu s informáciami od neurónov b a c. Tento reťazový proces pokračuje až po výstup, ktorý predstavuje odpoveď siete.
Rovnako ako pri učení s učiteľom sa sieť trénuje pomocou označených údajov, aby sa naučila prispôsobiť parametre neurónov a vytvoriť čo najsilnejší model.
Aplikácie a efekt „čiernej skrinky“
Neurónové siete nachádzajú uplatnenie v mnohých oblastiach, ako je zdravotníctvo, spracovanie prirodzeného jazyka či analýza obrazov. Napriek tomu však hlboké učenie vyvoláva isté obavy. Prečo? Kvôli efektu čiernej skrinky. Inými slovami, bežne nerozumieme presne tomu, čo sa deje v skrytých vrstvách.
V skutočnosti sú princípy fungovania neurónových sietí dobre známe. Väčším tajomstvom je, ako algoritmus dokáže prispôsobiť hodnoty parametrov a dosiahnuť také pôsobivé výsledky… ktoré však môžu obsahovať chyby alebo skreslenia.
Jednou z hlavných výziev budúcnosti bude zvýšiť transparentnosť fungovania týchto modelov a tiež údajov, ktoré ich trénujú, aby verejnosť mohla lepšie pochopiť – a prípadne spochybniť – rozhodnutia, ktoré stroje robia.