Услов:Основи програмирања, базе података, рачунарске мреже.
Циљ:Циљ предмета је оспособљавање студената за самосталанo решавање актуелних проблема у области анализе података. Посебно се анализирају концепти откривања знања у великим количинама података.
Исход:Након одслушаног курса студенти ће бити оспособљени да самостално израде инфраструктуру за анализу података коришћењем open-source софтвера и да примене алате за анализу и обраду података.
Садржај предмета
Теоријска настава:
Уводно предавање. Програм, организација и садржај предмета. Веза са другим курсевима.
Увод у архитектуру система за анализу података.
Нерелационе базе података.
Инфраструктура система за обраду података.
Складишта великих количина података.
Типови апликација и алати за анализу података.
Методе и алгоритми за откривање знања у подацима.
Упити над великим количинама података.
Системи и алати за извештавање.
Анализа структурираних и неструктурираних података. Преглед резултата.
Кластери рачунара. Појам и практична примена.
Сигурност и интегритет података.
Практична настава:
Лабораторијске вежбе прате предавања, при чему студенти решавају практичне проблеме у области анализе података коришћењем доступних библиотека. Оспособити полазнике курса за израду комплетних решења за обраду и анализу структурираних и неструктурираних података коришћењем open-source софтвера.
Литература
Д. Летић, MathCad 13 у математици и визуелизацији, Компјутер библиотека, 2007.
B.Marr, Big Data: Using SMART Big Data, Analytics and Metrics To Make Better Decisions and Improve Performance, Wiley, 2015.
M. Despotović-Zrakić, V.Milutinović, A.Belić, Handbook of Research on High Performance and Cloud Computing in Scientific Research and Education, IGI Global, 2014.
M.Minelli, M.Chambers,A.Dhiraj, Big Data, Big Analytics: Emerging Business Intelligence and Analytic Trends for Today’s Businesses, Wiley, 2013.