Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Efficient handling of lots of simulation data files

Konferenční objektopen accesspeer-reviewedpublished
dc.contributor.authorDiviš, Roman
dc.contributor.authorNovotný, Zdeněk
dc.date.accessioned2023-07-12T13:15:19Z
dc.date.available2023-07-12T13:15:19Z
dc.date.issued2022
dc.description.abstractSaving information to files is the most basic and simplest way to store data, so it is often used in simple simulators and simulation tools as the first choice for logging information about the simulation process and its results. Computer simulations often involve simulating a significant number of replications and accumulating large numbers of files. Today's filesystems are still not capable of efficiently storing and processing millions of files. This paper presents alternatives that allow for more efficient storage, transfer, and analysis of data, with an emphasis on easy migration or implementation from the initial data files. Simple approaches such as using TAR or ZIP archives to sophisticated approaches involving Parquet file, S3-like object storage (e.g., MinIO, OpenIO) and (non)relational databases will be compared.eng
dc.description.abstract-translatedUkládání informací do souborů je základním a jednoduchým způsobem ukládání dat, proto se často používá v simulátorech a simulačních nástrojích jako první volba pro protokolování informací o simulačním procesu a jeho výsledcích. Počítačové simulace často zahrnují simulaci značného počtu replikací a shromažďování velkého počtu souborů. Dnešní souborové systémy stále nejsou schopny efektivně ukládat a zpracovávat miliony souborů. Tento článek představuje alternativy, které umožňují efektivnější ukládání, přenos a analýzu dat, s důrazem na snadnou migraci nebo implementaci z původních datových souborů. Budou porovnány jednoduché přístupy, jako je použití archivů TAR nebo ZIP, až po sofistikované přístupy zahrnující soubor Parquet, úložiště objektů typu S3 (např. MinIO, OpenIO) a (ne)relační databáze.cze
dc.event34th European Modeling and Simulation Symposium, EMSS 2022 (19.09.2022 - 21.09.2022, Řím)eng
dc.formatp. 1-4eng
dc.identifier.doi10.46354/i3m.2022.emss.043
dc.identifier.isbn978-88-85741-73-7
dc.identifier.issn2724-0029
dc.identifier.obd39887999
dc.identifier.scopus2-s2.0-85142880239
dc.identifier.urihttps://hdl.handle.net/10195/81231
dc.language.isoeng
dc.peerreviewedyeseng
dc.project.IDSGS_2022_014/Aplikovaný výzkum a experimentální vývoj v oblasti matematicko-statistických technik, umělé inteligence a strojového učení pro inženýrské aplikace v radarové technice, výrobních technologiích, biomedicíně a dopravěcze
dc.publicationstatuspublishedeng
dc.publisherCAL-TEK SRLeng
dc.relation.ispartofProceedings of the 34th European Modeling & Simulation Symposium (EMSS 2022)eng
dc.relation.publisherversionhttps://www.cal-tek.eu/proceedings/i3m/2022/emss/043/
dc.rightsopen accesseng
dc.rights.licenseCC BY-NC-ND 4.0
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectdata files managementeng
dc.subjectdata storageeng
dc.subjectobject storageeng
dc.subjectspráva datových souborůcze
dc.subjectdatové úložištěcze
dc.subjectobjektové úložištěcze
dc.titleEfficient handling of lots of simulation data fileseng
dc.title.alternativeEfektivní zpracování velkého množství simulačních datových souborůcze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
document.pdf
Velikost:
114.22 KB
Formát:
Adobe Portable Document Format