Analiza velikog skupa podataka

Analiza velikog skupa podataka

Uključene obrazovne institucije

Elektrotehnički fakultet / Fakultet organizacionih nauka, Univerzitet u Beogradu

Dostupan u okviru programa

Master 4.0: Napredne informacione tehnologije u digitalnoj transformaciji (izborni)

Kratki program studija: Analiza podataka (izborni)

Kratki program studija: Distribuirano računarstvo (izborni)

Kratki program studija: Organizacija i upravljanje (izborni)

Cilj predmeta je da studenti sagledaju karakteristike i rešenja savremenih izazova u oblasti skladištenja i analitičkog procesiranja velikih i kompleksnih strukturiranih i nestrukturiranih skupova podataka (analitike velikog skupa podataka – big data).

Osposobljavanje za rad u najsavremenijim IT tehnologijama u oblasti baza podataka (NoSQL, NotOnlySQL, LogicalDataWarehouse, InMemoryComputing i BigData), koje sa druge strane čine osnovu razvoja IoT, Cloud, SmartMachines, BYOD tehnologija budućnosti. Studenti će biti osposobljeni da sagledaju izazove dizajna velikih baza podataka, dizajniraju i implementiraju praktične primere korišćenjem komercijalno raspoloživih alata. Studenti će moći da kritički razmatraju implementacije velike količine podataka, uzevši u obzir praktičnost i korisne metrike

Teorijska nastava

DB Taksonomija: DBMS modeli i arhitekture velikih baza podataka: NoSQL, NotOnlySQL, LogicalDataWarehouse, InMemoryComputing, BigData. Integracija DB : Integracija DB : language- oriented (embedded SQL); driver-oriented (ODBC, JDBC) (architectures, driver types, application scenarios); component-based; SOA integration; Web Services; agent-based; IoT, Cloud, SmartMachines, BYOD tehnologije budućnosti. Korišćenje AMDD razvojne metodologije. Životni ciklus napredne analitike podataka. Priprema i sređivanje podataka. Sumiranje podataka i vizuelizacija.Spark 2.0, Spark ML biblioteka.

Praktična nastava

Praktičan rad. Identifikovanje izazova dizajna takvih sistema koji uključuju analizu, sakupljanje, memorisanje, trajnost, obradu, vizualizaciju, pouzdanost i sigurnost, koristeći AMDD (Agile MDD) razvojnu metodologiju. Analiziraće se i komercijalno raspoloživi sistemi NoSQL (mongoDB, Cassandra, Hypertable,CouchDB) i BigData (Hadoop, ApacheSpark). Na kraju, studenti će se biti osposobljeni da samostalno evaluiraju i klasifikuju velike i kompleksne skupove podataka,
sagledaju izazove dizajna velikih baza podataka, dizajniraju i implementiraju praktične primere korišćenjem komercijalno raspoloživih alata.