IEP/K2 2024
- Ovaj rok nije rešen. Pomozite SI Wiki tako što ćete ga rešiti.
Drugi kolokvijum 2024. godine održan je 21. aprila. Na kolokvijumu su bili dostupni Spark dokumentacija, prezentacija sa predavanja, virtuelna mašina korišćena na predavanju i dva tekstualna fajla kao primeri unosa (bez očekivanog ispisa ili primera parametara).
Postavka
Posmatra se evidencija o rediteljima i scenaristima angažovanim na nekom filmu. U jednom redu se nalaze: identifikator filma, lista identifikatora reditelja, lista identifikatora scenarista. Podaci o osobama su dati u obliku: tconst (string) directors (array of nconsts) writers (array of nconsts)
- U programskom jeziku Java sastaviti MapReduce program koristeći Spark koji vraća statističke podatke o filmovima: minimalan broj reditelja, maksimalan broj reditelja, i prosečan broj reditelja po filmu, za filmove koji imaju barem jednu osobu koja je na datom filmu i scenarista i reditelj. Rezultat je jedan red ukupno. Voditi računa o konkurentnosti.
- U programskom jeziku Java sastaviti MapReduce program koristeći Spark koji vraća statističke podatke za sve osobe koje su na filmovima istovremeno bile i reditelji i scenaristi: minimalan broj filmova, maksimalan broj filmova, i prosečan broj filmova za filmove na kojima je data osoba bila i reditelj i scenarista, za reditelje koji imaju barem N unetih filmova (N parametar koji se prosleđuje računarima koji rade obradu) na kojima nisu nužno bili i scenaristi. Rezultat je jedan red ukupno. Voditi računa o konkurentnosti.
Odgovor[sic] se predaju u vidu dva[sic] java datoteka (FilmoviProsek.java
i OsobeProsek.java
).
Za testiranje su bili dostupni isti fajlovi kao i sa časova predavanja, koji se mogu naći u timu predmeta.