Mašinsko učenje

Mašinsko učenje (3)

Uključene obrazovne institucije

Univerzitet u Kragujevcu

Dostupan u okviru programa

Master 4.0: Master informacionih tehnologija (izborni)

Kratki program studija: Analiza podataka i distribuirano računarstvo (izborni)

Osposobljavanje studenata za razumevanje i praktičnu primenu koncepata nadgledanog mašinskog učenja u domenu regresije i klasifikacije.

Savladano gradivo omogućava studentu da:

– Razume ključne pojmove mašinskog učenja (teorijske pretpostavke, matematičke osnove, prednosti i nedostatke algoritama nadgledanog i nenadgledanog mašinskog učenja).
– Razlikuje bazne pristupe mašinskom učenju (parametarski/neparametarski, frekventistički/Bajesovski).
– Primeni postupak izbora i evaluacije optimalnih modela za dati problem.
– Efikasno primeni fundamentalne algoritme regresije i klasifikacije na probleme srednje
složenosti.

Teorijska nastava

Oblasti primene. Koncepti mašinskog učenja. Nadgledano učenje. Nenadgledano učenje. Predikcija. Modeli. Učenje hipoteza. Složenost modela. Šum. Unakrsna provera. Funkcija gubitka. Funkcija greške. Regresija. Srednja kvadratna greška. Probabilistička interpretacija. Metod najmanjih kvadrata. Algoritmi učenja. Parametri i hiperparametri. Pravilo ulančavanja. Gradijenti spust. Perceptron. Regresija i klasifikacija sa linearnim modelima. Linearni modeli. Višestruke linearne regresije. Binarna klasifikacija. Sigmoidna funkcija. Logistička regresija. Greška unakrsne entropije. Gradijenti spust logističke regresije. Njutn-Rafsonova metoda. Bajesov klasifikator. Multinomijalna klasifikacija. Stabla odlučivanja. ID3 algoritam. Neparametarski modeli. Metode najbližih suseda. k-NN (k-Nearest Neighbors). Nelinearna klasifikacija i regresija. Veštačke neuronske mreže sa prostiranjem unapred. Overfitting. Underfitting. Regularizacija. Aktivacione funkcije u ANN. Softmax funkcija. Algoritam backpropagation. Jezgrene funkcije. RBF jezgra. Metode vektora podrške (Support Vector Machine-SVM). Problem maksimalne margine. Kvadratno programiranje. Lagranžeova dualnost. Optimizacija maksimalne margine. Dualni model SVM-a. Vrednovanje klasifikatora. Konfuziona matrice. Glasanje. „No free lunch” teorema. Stacking. Bagging. Boosting. Boosted regression trees.

Praktična nastava

Primena softverskih alata i implementacija rešenja u R okruženju (paketi: neuralnet, base paket, MASS, H2o, Keras, Tensorflow, MXnet, e1071, class…). Rad na vežbama podrazumeva primenu stečenog znanja na rešavanje konkretnih zadataka u domenu nadgledanog mašinskog učenja.