Temelji programiranja i ekstrakcije znanja
OPIS PREDMETA
Nastava: 12 sati
ECTS bodovi: 3
Cilj predmeta:
Jasno razlučiti osnovne pojmove vezane za
programiranje, korištenje računala i ekstrakciju znanja (data
mining). Usvojiti praktične metode programiranja za obradu teksta, tehničko
programiranje i ekstrakciju znanja.
Sadržaj predmeta:
Vrste i strukture podataka, Turingov stroj, algoritmi i njihova složenost,
kompajleri i interpreteri, objektno programiranje.
Struktura računalne memorije i posljedice na razvoj programa.
Programiranje za obradu teksta (HTML, LaTeX, XML).
Osnove tehničkog računanja (Matlab).
Klasteriranje podataka (grafova) pretraživanjem (metoda k-sredina), Fiedlerov vektor i analiza
principalnih komponenti grafa, model vektorskog prostora i primjena na
tekstualne kolekcije podataka.
Opće i specifične kompetencije:
Sposobnost analize algoritamskih problema s aspekta složenosti i odabira
adekvatnog načina rješavanja. Razumijevanje programiranja za obradu teksta i
sposobnost samostalnog programiranja. Razumjevanje tehničkih programa i
sposobnost izrade i primjene istih na analizu podataka. Razumijevanje
algoritama za ekstrakciju znanja i sposobnost primjene algoritama u
znanstveno-istraživačkom radu.
PRVI DOMAĆI RAD - HTML i JavaScript
DRUGI DOMAĆI RAD - Sortiranje u Matlabu i LaTeX
LITERATURA
-
Mitra S, Acharya T, Data Mining - Multimedia, Soft Computing and
Bioinformatics, John Wiley & Sons, 2003.
(info)
-
Sigmon K, MATLAB Primer, Third Edition, University of Florida, Gainesville,
1993. (link)
(lokalni link)
-
Oetiker T, Partl H, Hyna I, Schlegl E, The Not So Short Introduction to
LaTeX2e, 1999.
(link)
(lokalni link)
-
Berry MW, Drmač Z, Jessup ER, Matrices, Vector Spaces and Information
Retrieval, SIAM Review, 41 (1999) 335-362.
(link)
(lokalni link)
-
The Java Tutorial
(link)
(lokalni link -
Tutorial)
(lokalni link -
Primjeri)
(lokalni link -
Swing)
-
Ding HQ, Zha H, He X, Husbands P, Simon HD, Link analysis: Hubs and
Authorities on the World Wide Web, SIAM Review, 46 (2004) 256-269.
(link)
(lokalni link)
-
Langville AN, Meyer CD, A Survey of Eigenvector Methods for Web Information
Retrieval, SIAM Review, 47 (2005) 135-161.
(link)
(lokalni link)
-
A Beginner's Guide to HTML
(lokalni link)
IZVEDBENI PLAN
-
Algoritam. Program i programiranje. Interpreteri i kompajleri.
-
Model podataka. Složene strukture podataka. Programske paradigme.
Objektno orjentirano programiranje.
-
Turingov stroj - model univerzalnog računala.
Izračunljivost funkcija.
Konačnost algoritma.
Efikasnost algoritma.
-
Struktura računalne memorije i posljedice na razvoj programa.
Skriptni jezici - serverski (PHP) i klijentski (JavaScript).
-
Programiranje za obradu teksta (HTML, CSS, LaTeX, XML).
-
Osnove tehničkog računanja (Matlab).
-
Metoda najmanjih kvadrata - linearna regresija.
-
Klasteriranje podataka (grafova) pretraživanjem (metoda k-sredina).
-
Fiedlerov vektor i analiza principalnih komponenti grafa.
-
Model vektorskog prostora.
-
Primjena na tekstualne kolekcije podataka.
-
Seminarski rad.
NASTAVNI MATERIJALI
-
Osnove programiranja i
strukture podataka
-
Osnove programiranja i
strukture podataka
The Java Tutorial
-
Turingov stroj, konačnost i
efikasnost algoritma
-
Višeprocesorsko računanje
(izvadak)
Art of Interactive Scientific Web Design
PHP from Wikipedia
PHP from
W3Schools
JavaScript from
Wikipedia
JavaScript from W3Schools
-
HTML from Wikipedia
HTML from
W3Schools
A Beginner's Guide to HTML
CSS from Wikipedia
CSS from W3Schools
LaTeX from Wikipedia
The Not So Short Introduction to
LaTeX2e
Materijali za LaTeX
(1. dio,
2. dio,
3. dio,
4. dio,
5. dio,
zadaci.)
XML from Wikipedia
XML from
W3Schools
-
Octave On-line
MATLAB Primer, Third Edition
Octave Users' Guide
Einführung in MATLAB
-
Metoda najmanjih kvadrata i QR rastav
-
K-means from
Wikipedia
K-means metoda za
particioniranje podataka
A Tutorial on Clustering Algorithms (vidi "K-means" i
"Interactive Demo")
-
Principal component analysis from Wikipedia
Spektralno
biparticioniranje grafa
(Spektralno
k-particioniranje grafa)
programi
programi
-
Matrices, Vector Spaces and Information
Retrieval
Model vektorskog prostora
-
Spektralno
particioniranje bipartitnog grafa