Digitální knihovna UPCE přechází na novou verzi. Omluvte prosím případné komplikace. / The UPCE Digital Library is migrating to a new version. We apologize for any inconvenience.

Publikace:
Design of a Low Power and Area Efficient Bfloat16 based Generalized Systolic Array for DNN Applications

Konferenční objektopen accesspeer-reviewedpostprint (accepted version)
dc.contributor.authorTiwari, Ankita
dc.contributor.authorMishra, Saras Mani
dc.contributor.authorGuha, Prithwijit
dc.contributor.authorPidanič, Jan
dc.contributor.authorNěmec, Zdeněk
dc.contributor.authorTrivedi, Gaurav
dc.date.accessioned2023-07-12T13:18:48Z
dc.date.available2023-07-12T13:18:48Z
dc.date.issued2022
dc.description.abstractNowadays demand for artificial intelligence (AI) enabled mobile platforms is increasing. From healthcare services to defense and from remote to urban area, there is a huge demand of secured and power efficient devices. The performance of these platforms can be enhanced by providing an efficient compute engine. These compute engines perform a huge amount of matrix operations. The most popular choice for large matrix computation is a systolic array. In general, the systolic array performance degrades for the large input matrices, due to the trade off between resource utilization and computation delay. To address this issue, we need a systolic array with a control unit to re-configure the array according to the requirement of the computation. Computation array can be further improved by handling the negative weights and reduce the MAC operations. In this paper, we proposed a generalized bfloat16 based systolic array in which the sign of the partial sum (PS) is predicted before computation. The PS sign aids in network pruning which enhances system performance. The proposed system is implemented on a Virtex-7 FPGA board and it performs 2.21 similar to and 4.19x better in terms of area and power compared to single-precision based systolic array.eng
dc.description.abstract-translatedV současné době roste poptávka po mobilních platformách s umělou inteligencí (AI). Od zdravotnických služeb až po obranu a od vzdálených až po městské oblasti existuje obrovská poptávka po zabezpečených a energeticky účinných zařízeních. Výkon těchto platforem lze zvýšit poskytnutím efektivního výpočetního jádra. Tyto výpočetní motory provádějí obrovské množství maticových operací. Nejoblíbenější volbou pro velké maticové výpočty je systolické pole. Obecně platí, že výkonnost systolického pole se pro velké vstupní matice zhoršuje v důsledku kompromisu mezi využitím prostředků a zpožděním výpočtu. K řešení tohoto problému potřebujeme systolické pole s řídicí jednotkou, která by změnila konfiguraci pole podle požadavku výpočtu. Výpočetní pole lze dále vylepšit zpracováním záporných vah a omezit operace MAC. V tomto článku jsme navrhli zobecněné systolické pole založené na bfloat16 , ve kterém se před výpočtem předpovídá znaménko částečného součtu (PS). Znaménko PS pomáhá při ořezávání sítě, což zvyšuje výkonnost systému. Navržený systém je implementován na desce Virtex-7 FPGA a ve srovnání se systolickým polem založeným na jedné přesnosti má výkon 2,21 podobný a 4,19x lepší z hlediska plochy a výkonu.cze
dc.event32nd International Conference on Radioelectronics (RADIOELECTRONICS) (21.04.2022 - 22.04.2022, Kosice)eng
dc.formatp. 44-48eng
dc.identifier.doi10.1109/RADIOELEKTRONIKA54537.2022.9764899
dc.identifier.isbn978-1-72818-686-3
dc.identifier.obd39888114
dc.identifier.scopus2-s2.0-85130107446
dc.identifier.urihttps://hdl.handle.net/10195/81282
dc.identifier.wos000856002200011
dc.language.isoeng
dc.peerreviewedyeseng
dc.project.IDLTAIN19100/Vývoj bezkontaktní technologie pro inteligentní ochranu zájmových prostorcze
dc.publicationstatuspostprint (accepted version)eng
dc.publisherIEEEeng
dc.relation.ispartof2022 32ND INTERNATIONAL CONFERENCE RADIOELEKTRONIKA (RADIOELEKTRONIKA)eng
dc.relation.publisherversionhttps://ieeexplore.ieee.org/document/9764899
dc.rightsopen access (green)eng
dc.subjectsystoliceng
dc.subjectfloating-point number systemeng
dc.subjectBfloat16eng
dc.subjectDNNeng
dc.subjectsystolickýcze
dc.subjectčíselný systém s plovoucí desetinnou čárkoucze
dc.subjectBfloat16cze
dc.subjectDNNcze
dc.titleDesign of a Low Power and Area Efficient Bfloat16 based Generalized Systolic Array for DNN Applicationseng
dc.title.alternativeNávrh zobecněného systolického pole na bázi Bfloat16 s nízkou spotřebou energie a efektivní plochou pro aplikace DNNcze
dc.typeConferenceObjecteng
dspace.entity.typePublication

Soubory

Původní svazek

Nyní se zobrazuje 1 - 1 z 1
Načítá se...
Náhled
Název:
Design_of_a_Low_Power_and_Area_Efficient_Bfloat16_based_Generalized_Systolic_Array_for_DNN_Applications.pdf
Velikost:
2.78 MB
Formát:
Adobe Portable Document Format
Popis: