Temelji
Duboko učenje
Grana strojnog učenja koja koristi višeslojne neuronske mreže za učenje složenih obrazaca; pogoni suvremeni vid, govor i jezične AI sustave.
Duboko učenje je podgrana strojnog učenja koja gradi neuronske mreže s mnogo slaganih slojeva reprezentacije. Svaki sloj svoj ulaz pretvara u nešto apstraktniji prostor značajki, a kompozicija tih transformacija omogućuje modelu da uhvati uzorke izvan dosega klasičnih algoritama — od rubova do oblika do objekata u vidu, od znakova do riječi do značenja u jeziku.
Suvremeno doba započelo je oko 2012., kada je duboka konvolucijska mreža (AlexNet) razbila ImageNet benchmark za klasifikaciju slika. Recept — veliki označeni skupovi, GPU snaga i end-to-end treniranje kroz backpropagation — brzo se proširio na prepoznavanje govora, strojno prevođenje, igranje igara i naposljetku generativne modele. Yann LeCun, Yoshua Bengio i Geoffrey Hinton dobili su Turingovu nagradu 2018. za temeljni rad.
Duboko učenje je u osnovi gotovo svega o čemu pišemo. Transformer arhitektura i veliki jezični modeli koji rastu iz nje su sustavi dubokog učenja s milijardama do trilijuna parametara. Generatori slika, modeli za govor, prediktori strukture proteina i percepcijski stackovi autonomnih vozila dijele isto načelo: slagati diferencijabilne slojeve, trenirati gradijentnim spustom i pustiti skalu da odradi velik dio posla.