Monitoring Of Apartment Prices In The Czech Republic Through Parsing A Web Advertising Server

Zobrazit minimální záznam

dc.contributor.author Pozdílková, Alena
dc.contributor.author Marek, Jaroslav
dc.contributor.author Nedvědová, Marie
dc.date.accessioned 2021-05-15T18:49:08Z
dc.date.available 2021-05-15T18:49:08Z
dc.date.issued 2020
dc.identifier.issn 1335-8243
dc.identifier.uri https://hdl.handle.net/10195/77373
dc.description.abstract Time series of apartment prices in the Czech Republic are available only in the partial statistics of the Statistical Office. Apartment prices are presented mainly in the articles and comments from the real estate agents. Data unavailability leads to a small number of statistically oriented publications on the real estate market. The main aim of our paper is thus to introduce a software solution for parsing real estate websites. Of course, we are only able to retrieve data on demanded prices from advertisements, actual prices are not achieved. By automatic polling, we are able to get data on the floor area of advertised apartments and the asked purchase price. A Python script was written to retrieve data from sreality.cz. The MongoDB database is used to store ads. New ads are saved directly to the database. Then, daily average apartment price of 1 square meter for each municipality are calculated. The filtered data can then be displayed or exported to a file via the web interface. In the statistical analyses, we present graphs showing the development of apartment prices and the number of advertisements in various municipalities of the Czech Republic in the period of 09/2018 – 12/2019. Next, we address the issue of clustering of municipalities with regard to the similarity of relative price changes. eng
dc.format p. 9-14 eng
dc.language.iso eng
dc.relation.ispartof Acta Electrotechnica et Informatica, volume 20, issue: 1 eng
dc.rights open access (CC BY 4.0) eng
dc.rights.uri https://creativecommons.org/licenses/by/4.0/
dc.subject web page parsing eng
dc.subject analýza webových stránek cze
dc.subject real estate market eng
dc.subject time series eng
dc.subject apartment prices eng
dc.subject floor area eng
dc.subject purchased price eng
dc.subject cluster analysis eng
dc.subject trh s nemovitostmi cze
dc.subject časová řada cen bytů cze
dc.subject podlahová plocha cze
dc.subject kupní cena cze
dc.subject shluková analýza cze
dc.title Monitoring Of Apartment Prices In The Czech Republic Through Parsing A Web Advertising Server eng
dc.title.alternative Monitorování cen bytů v České republice pomocí analýzy webového inzertního serveru cze
dc.type article eng
dc.description.abstract-translated Časové řady cen bytů v České republice bývají k dispozici pouze v dílčích statistikách Statistického úřadu. Ceny bytů jsou prezentovány hlavně v článcích a komentářích realitních agentů. Nedostupnost dat vede k malému počtu statisticky orientovaných publikací o realitním trhu. Hlavním cílem našeho příspěvku je tedy představit softwarové řešení pro analýzu realitních webů. Z nich jsme schopni načíst pouze údaje o požadovaných cenách z inzerátů, skutečné prodejní ceny nejsou takto získány. Díky automatickému dotazování jsme schopni získat údaje o podlahové ploše inzerovaných bytů a požadované kupní ceně. K načtení dat ze sreality.cz byl napsán skript v Pythonu. Databáze MongoDB se použila k ukládání inzerátů. Nové inzeráty se ukládají přímo do databáze. Poté jsme vypočetli denní průměrnou cena bytu 1 metr čtvereční pro každou obec. Filtrovaná data bylo možno poté zobrazit nebo exportovat do souboru prostřednictvím webového rozhraní. Ve statistických analýzách budeme prezentovat grafy vývoje cen bytů a počtu inzerátů v různých obcích České republiky v období 09/2018 - 12/2019. Dále jsme se věnovali otázce shlukování obcí podle podobnosti vývoje cen. cze
dc.peerreviewed yes eng
dc.publicationstatus published version eng
dc.identifier.doi 10.15546/aeei-2020-0002
dc.relation.publisherversion http://www.aei.tuke.sk/papers/2020/1/2_Pozdilkova.pdf
dc.project.ID SGS_2020_011/Výzkum pokročilých metod zpracování signálů a obrazu, výkonnosti webových aplikací, měření, dolování dat, řízení technologických procesů a optimalizace cze
dc.identifier.obd 39885191


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

open access (CC BY 4.0) Kromě případů, kde je uvedeno jinak, licence tohoto záznamu je open access (CC BY 4.0)

Vyhledávání


Rozšířené hledání

Procházet

Můj účet