Obrada velikih količina podataka

Obrada velikih količina podataka

Uključene obrazovne institucije

Univerzitet u Kragujevcu

Dostupan u okviru programa

Master 4.0: Master informacionih tehnologija (izborni)

Kratki program studija: Analiza podataka i distribuirano računarstvo (obavezni)

Upoznavanje sa osnovama skladištenja, obrade i analize velike količine podataka korišćenjem
solidne matematičkih osnova i aktuelnih softverskih alata.

Student poznaje i razume matematičku bazu, standarde i tehnologije koje se bave skladištenjem, obradom i analizom masovnih podataka. Sposoban je da samostalno kreira aplikaciju za podršku odlučivanju koja kao ulaz koristi veliku količinu podataka.

Teorijska nastava

Matematičke osnove. Naučne i poslovne aplikacije velike količine podataka. Skaliranje u bazama podataka kao što su MongoDB, Cassandra i Neo4J. Optimizacije i heuristike nad velikom količinom podataka. Klaster računarstvo pomoću alata Hadoop, Spark i Hive. Napredna primena
Spark-a pomoću biblioteka MLib i SparkSQL.

Praktična nastava

Kreiranje ilustrativnih aplikacija primenom aktuelnih Big Data tehnologija. Samostalni razvoj i
kreiranje klaster aplikacija kako upotrebom baznog RDD pristupa u Spark-u, tako i pozivanjem
rutina iz biblioteka.