Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
A Novel Approach to Regression: Exploring the Similarity Space with Ordinary Least Squares on Database Records

Konferenční objektopen accesspeer-reviewedpublished
dc.contributor.authorRozinek, Ondřejcze
dc.contributor.authorBorkovcová, Monikacze
dc.date.accessioned2025-10-07T09:58:08Z
dc.date.issued2024eng
dc.description.abstractThe proliferation of textual data, notably in the form of database records, calls for innovative methods of analysis that go beyond traditional numerical techniques. While least squares regression has been a cornerstone in quantitative data analysis, its applicability to textual data remains largely unexplored. This study aims to bridge this gap by introducing a similarity-based least squares method tailored for textual data. Drawing on the principles of similarity measures in text, such as semantic and syntactic closeness, we propose an extension to the conventional least squares framework. Our approach incorporates wordbased similarity metrics into the least squares objective function, enabling the analysis of textual data in a manner coherent with its qualitative nature. The developed methodology is rigorously evaluated using both synthetic and real-world database records, demonstrating its efficacy in uncovering intricate relationships within textual data. Our findings open new avenues for textual data analysis, blending the precision of class.eng
dc.description.abstract-translatedŠíření textových dat, zejména ve formě databázových záznamů, vyžaduje inovativní metody analýzy, které jdou nad rámec tradičních numerických technik. Zatímco regrese nejmenších čtverců byla základním kamenem kvantitativní analýzy dat, její použitelnost na textová data zůstává do značné míry neprozkoumaná. Tato studie si klade za cíl překlenout tuto mezeru zavedením metody nejmenších čtverců založené na podobnosti přizpůsobené pro textová data. Na základě principů míry podobnosti v textu, jako je sémantická a syntaktická blízkost, navrhujeme rozšíření konvenčního rámce nejmenších čtverců. Náš přístup zahrnuje metriky podobnosti založené na slovech do objektivní funkce nejmenších čtverců, což umožňuje analýzu textových dat způsobem, který je v souladu s jejich kvalitativní povahou. Vyvinutá metodika je důsledně hodnocena pomocí syntetických i reálných databázových záznamů, což prokazuje její účinnost při odhalování složitých vztahů v rámci textových dat. Naše zjištění otevírají nové cesty pro analýzu textových dat a spojují přesnost třídy.cze
dc.event34th Conference of Open Innovations Association FRUCT, FRUCT 2023 (15.11.2023 - 17.11.2023, Riga)eng
dc.formatp. 270-277eng
dc.identifier.isbn978-952-65-2460-3
dc.identifier.issn2305-7254
dc.identifier.obd39889609
dc.identifier.urihttps://hdl.handle.net/10195/85969
dc.language.isoeng
dc.peerreviewedyeseng
dc.publicationstatuspublishedeng
dc.publisherIEEE (Institute of Electrical and Electronics Engineers)eng
dc.relation.ispartofConference of Open Innovation Association, FRUCTeng
dc.relation.publisherversionhttps://fruct.org/publications/volume-34/acm34/
dc.rightsopen accesseng
dc.subjectsimilarity space, linear regression, similarity searcheng
dc.subjectpodobnostní prostor, lineární regrese, podobnostní vyhledávánícze
dc.titleA Novel Approach to Regression: Exploring the Similarity Space with Ordinary Least Squares on Database Recordseng
dc.title.alternativeNový přístup k regresi: Zkoumání prostoru podobnosti s obyčejnými nejmenšími čtverci v záznamech databázecze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
Roz.pdf
Velikost:
699.36 KB
Formát:
Adobe Portable Document Format