Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Clustering analysis of phonetic and text feature vectors

Konferenční objektopen accesspeer-reviewedpostprint
dc.contributor.authorJičínský, Milancze
dc.contributor.authorMarek, Jaroslavcze
dc.date.accessioned2018-02-27T02:46:11Z
dc.date.available2018-02-27T02:46:11Z
dc.date.issued2017eng
dc.description.abstractOur goal is to show an example of using statistical methods to analyse some attributes of speeches. For this purpose, the New Year’s Day speeches of Czech and Czechoslovak presidents are chosen. The aim of our study is researching similarities among these speeches and their recognizability through the history of Czechoslovak politics. All presidents are compared between each other. The comparison method is based on principal component analysis and cluster analysis. Important part is creating a feature vector. The feature vector doesn't have to be the same for successful clustering. There are many varieties and combinations of features that can be selected and used. Correlated variables must be discarded. The most significant features are chosen to represent and characterize the speaker. Some speakers can have something in common according to the chosen features. Or on the other hand they can differ much more from others. This kind of approach can help us to recognize a speech pattern of each spokesman independently.eng
dc.description.abstract-translatedCílem článku je prezentovat využití statistických metod k analýze vlastností řeči a textu. Jako vhodné testovací soubory byly zvoleny novoroční projevy českých a československých prezidentů. V publikaci jsou hledány podobnosti mezi jednotlivými novoročními projevy. Zkoumá se rozpoznatelnost řečníků na základě několika textových a fonetických charakteristik. Srovnávací metoda je založena na analýze hlavních komponent a shlukování. Nejdůležitější částí celého procesu je ovšem vytvoření vhodného příznakového vektoru. Takový vektor může být vytvořen různými způsoby a jednotlivé kombinace parametrů mohou vést k různým výsledkům. Charakteristiky, které podléhají korelaci, nebudou pro analýzu použity. Celý výzkum tedy staví na tom, že někteří řečníci budou mít společné řečové charakteristiky a jiní se budou naopak velmi lišit. Tento přístup umožňuje rozeznávat společné a opakující se znaky jednotlivých řečníků.cze
dc.event2017 IEEE 14th International Scientific Conference on Informatics INFORMATICS 2017 (14.11.2017 - 16.11.2017, Poprad)eng
dc.formatp. 146-151eng
dc.identifier.isbn978-1-5386-0888-3eng
dc.identifier.obd39880001eng
dc.identifier.scopus2-s2.0-85050617515
dc.identifier.urihttps://hdl.handle.net/10195/69854
dc.language.isoengeng
dc.peerreviewedyeseng
dc.project.IDSGS_2017_024/Algoritmy fonetické analýzy a matematické estetikyeng
dc.publicationstatuspostprinteng
dc.publisherIEEE (Institute of Electrical and Electronics Engineers)eng
dc.relation.ispartofProceeding of 2017 IEEE 14TH International Scientific Conference on Informaticseng
dc.rightsopen accesseng
dc.subjectcluster analysiseng
dc.subjectNew Year’s Day speecheseng
dc.subjectPresidenteng
dc.subjectfeature vectorseng
dc.subjectvoice analysiseng
dc.subjectenergyeng
dc.subjectzero crossing rateeng
dc.subjectspeech velocityeng
dc.subjectlinguisticseng
dc.subjectphoneticseng
dc.subjectsegmentationeng
dc.subjectframeseng
dc.subjectaudio processingeng
dc.subjectspeaker comparisoneng
dc.subjectprincipal component analysiseng
dc.subjectshlukovánícze
dc.subjectnovoroční projevycze
dc.subjectprezidentcze
dc.subjectpříznakový vektorcze
dc.subjectanalýza hlasucze
dc.subjectenergiecze
dc.subjectpočet průchodů nuloucze
dc.subjectrychlost řečicze
dc.subjectlingvistikacze
dc.subjectfonetika, segmentacecze
dc.subjectzpracování zvukucze
dc.subjectporovnání řečníkůcze
dc.subjectmetoda hlavních komponentcze
dc.titleClustering analysis of phonetic and text feature vectorseng
dc.title.alternativeShlukování fonetických a textových charakteristikcze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
inf2017_75_Jicinsky.pdf
Velikost:
642.8 KB
Formát:
Adobe Portable Document Format