Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Extraction of Outliers from Imbalanced Sets

Konferenční objektopen accesspeer-reviewedpostprint
dc.contributor.advisor
dc.contributor.authorŠkrabánek, Pavelcze
dc.contributor.authorMartínková, Natáliacze
dc.date.accessioned2018-02-27T02:36:38Z
dc.date.available2018-02-27T02:36:38Z
dc.date.issued2017eng
dc.description.abstractIn this paper, we presented an outlier detection method, designed for small datasets, such as datasets in animal group behaviour research. The method was aimed at detection of global outliers in unlabelled datasets where inliers form one predominant cluster and the outliers are at distances from the centre of the cluster. Simultaneously, the number of inliers was much higher than the number of outliers. The extraction of exceptional observations (EEO) method was based on the Mahalanobis distance with one tuning parameter. We proposed a visualization method, which allows expert estimation of the tuning parameter value. The method was tested and evaluated on 44 datasets. Excellent results, fully comparable with other methods, were obtained on datasets satisfying the method requirements. For large datasets, the higher computational requirement of this method might be prohibitive. This drawback can be partially suppressed with an alternative distance measure. We proposed to use Euclidean distance in combination with standard deviation normalization as a reliableeng
dc.description.abstract-translatedČlánek přináší popis metody určené k detekci odlehlých hodnot v datových sadách s malým počtem pozorování, kde správná pozorování tvoří jeden klastr. Pro správnou funkčnost je potřeba, aby počet správných pozorování byl výrazně vyšší než počet odlehlých pozorování. Metoda je založena na Mahalanobis vzdálenosti.cze
dc.event12th International Conference, HAIS 2017 (21.06.2017 - 23.06.2017, La Rioja)eng
dc.formatp. 402-412eng
dc.identifier.doi10.1007/978-3-319-59650-1_34
dc.identifier.isbn978-3-319-59649-5eng
dc.identifier.issn0302-9743eng
dc.identifier.obd39879485eng
dc.identifier.scopus2-s2.0-85021705636
dc.identifier.urihttps://hdl.handle.net/10195/69780
dc.identifier.wos000432880600034
dc.language.isoengeng
dc.peerreviewedyeseng
dc.publicationstatuspostprinteng
dc.publisherSpringereng
dc.relation.ispartofHybrid Artificial Intelligent Systems : 12th International Conference, HAIS 2017, proceedingseng
dc.relation.publisherversionhttps://link.springer.com/chapter/10.1007%2F978-3-319-59650-1_34
dc.rightsembargoed accesseng
dc.subjectoutlier analysiseng
dc.subjectdistance based methodeng
dc.subjectglobal outliereng
dc.subjectsingle clustereng
dc.subjectMahalanobis distanceeng
dc.subjectbiologyeng
dc.titleExtraction of Outliers from Imbalanced Setseng
dc.title.alternativeExtrakce odlehlých hodnot z nevyvážených datových sadcze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
HAIS49.pdf
Velikost:
362.65 KB
Formát:
Adobe Portable Document Format