KARPÍŠEK, M. Systém pro získávání a analýzu realitních dat z WWW [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Burget, Radek

Pan Karpíšek pracoval velmi samostatně a oceňuji jeho aktivní přístup. Na druhou stranu konzultační aktivita mohla být vyšší a dokončování probíhalo poněkud na poslední chvíli. Celkově hodnotím jeho práci jako průměrnou.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem zadání byl průzkum možností získávání dat o nemovitostech z různých realitních serverů a návrh a implementace řešení, které úmožní tato data integrovat a dále analyzovat se zaměřením na podporu rozhodování investorů. Zadání považuji za splněné.
Práce s literaturou Student si aktivně a samostatně vyhledával informační zdroje.
Aktivita během řešení, konzultace, komunikace Student pracoval velmi samostatně, nekonzultoval příliš často, ale o důležitých rozhodnutích ohledně svého řešení mě řádně informoval. Sám aktivně navrhoval způsob řešení jednotlivých dílčích částí.
Aktivita při dokončování Práce byla dokončována poněkud v časové tísni. Měl jsem možnost připomínkovat technickou zprávu a téměř dokončenou aplikaci, konečnou verzi jsem již bohužel neviděl.
Publikační činnost, ocenění
Navrhovaná známka
C
Body
75

Posudek oponenta

Hynek, Jiří

Práce obsahuje některé nedostatky v prezentaci praktických výsledků v technické zprávě, které jsou vyváženy samotnými realizačními výstupy. Navrhuji hodnocení stupněm B .

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Cílem práce bylo navrhnout a implementovat systém, který bude získávat a analyzovat data z existujících realitních serverů. Student se konkrétně zaměřil na 4 realitní servery, z kterých pomocí techniky web scraping doluje data o aktuálních nabídkách nemovitostí a jejich charakteristikách. Tyto charakteristiky spolu s daty z Českého statistického úřadu využívá na odhad nájmu a predikci návratnosti investice (s využitím různých modelů, např. průměrování, polynomiální regrese, apod.). Student prostudoval technolgie Airflow (pro datové pipelines), PostgreSQL (pro uložení dat), Superset (pro vizualizaci dat) nebo Docker. Zadání hodnotím jako průměrně obtížné a považuji ho za splněné.
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy 65 Teoretická část práce je na dobré úrovni. Kapitola 2 by nicméně mohla být obsáhlejší. Popis praktické části práce by mohl být strukturován lépe. Chybí popis analýzy problému. Popis návrhu a implementace je nešťastně spojen do jedné kapitoly. Architektura systému by měla být popsána lépe.
Formální úprava technické zprávy 75 Po formální stránce je práce na průměrné úrovni . Místy se vyskytují typografické chyby (vícenásobné citace, pomlčky, drobný text v obrázcích), případně chybí čárky.
Práce s literaturou 89 Práce s literaturou je na dobré úrovni . Student prostudoval velké množství zdrojů. V některých případech čerpá ze zdrojů s nejasným autorem (např. Wikipedia).
Realizační výstup 85 Realizační výstupy jsou na dobré úrovni. Jádrem práce je část systému, která se stará dolování dat, ukládání a vyhodnocování dat. Klientská část vytvořená pomocí nástroje Apache Superset slouží pouze pro demonstraci výsledků. Student využil nástroj Docker. Součástí řešení je soubor README dokumentující použití nástroje.
Využitelnost výsledků Výsledek je možné považovat za proof of concept . Vzhledem k faktu, že dolovaná data podléhají licenci realitních webů, je možné výsledek použít pouze pro akademické účely . Nicméně i to lze považovat za hodnotné řešení.
Navrhovaná známka
B
Body
80

Otázky

eVSKP id 147709