Comparison of ReLU and linear saturated activation functions in neural network for universal approximation

Zobrazit minimální záznam

dc.contributor.author Štursa, Dominik cze
dc.contributor.author Doležel, Petr cze
dc.date.accessioned 2020-03-19T13:17:18Z
dc.date.available 2020-03-19T13:17:18Z
dc.date.issued 2019 eng
dc.identifier.isbn 978-1-72813-758-2 eng
dc.identifier.uri https://hdl.handle.net/10195/75129
dc.description.abstract Activation functions used in hidden layers directly affect the possibilities for describing nonlinear systems using a feedforward neural network. Furthermore, linear based activation functions are less computationally demanding than their nonlinear alternatives. In addition, feedforward neural networks with linear based activation functions can be advantageously used for control of nonlinear systems, as shown in previous authors' publications. This paper aims to compare two types of linear based functions - symmetric linear saturated function and the rectifier linear unit (ReLU) function as activation functions of the feedforward neural network used for a nonlinear system approximation. Topologies with one hidden layer and the combination of defined quantities of hidden layer neurons in the feedforward neural network are used. Strict criteria are applied for the conditions of the experiments; specifically, the Levenberg-Marquardt algorithm is applied as a training algorithm and the Nguyen-Widrow algorithm is used for the weights and biases initialization. Three benchmark systems are then selected as nonlinear plants for approximation, which should serve as a repeatable source of data for testing. The training data are acquired by the computation of the output as a reaction to a specified colored input signal. The comparison is based on the convergence speed of the training for a fixed value of the error function, and also on the performance over a constant number of epochs. At the end of the experiments, only small differences between the performance of both applied activation functions are observed. Although the symmetric linear saturated activation function provides the lesser median of the final error function value across the all tested numbers of neurons in topologies, the ReLU function seems to be also capable of use as the activation function for nonlinear system modeling. eng
dc.format p. 146-151 eng
dc.language.iso eng eng
dc.publisher IEEE (Institute of Electrical and Electronics Engineers) eng
dc.relation.ispartof Proceedings of the 2019 22nd International Conference on Process Control, PC 2019 eng
dc.rights open access eng
dc.subject Feedforward neural network eng
dc.subject linear saturated activation function eng
dc.subject rectified linear activation function eng
dc.subject nonlinear system identification eng
dc.subject Dopředná neuronová síť cze
dc.subject lineární saturovaná aktivační funkce cze
dc.subject ReLU cze
dc.subject identifikace nelineárních systémů cze
dc.title Comparison of ReLU and linear saturated activation functions in neural network for universal approximation eng
dc.title.alternative Porovnání ReLU a lineární saturované aktivační funkce v neuronové síti pro univerzální aproximaci cze
dc.type ConferenceObject eng
dc.description.abstract-translated Aktivační funkce používané ve skrytých vrstvách přímo ovlivňují možnosti popisu nelineárních systémů pomocí dopředné neuronové sítě. Kromě toho jsou lineární aktivační funkce méně výpočetně náročné než jejich nelineární alternativy. Dále lze pro řízení nelineárních systémů s výhodou použít dopředné neuronové sítě s aktivačními funkcemi založenými na lineárním uspořádání, jak je ukázáno v předchozích autorských publikacích. Tato práce si klade za cíl porovnat dva typy lineárních funkcí - symetrické lineární saturované funkce a ReLU jako aktivační funkce dopředné neuronové sítě používané pro nelineární aproximaci chování dynamického systému. Používají se topologie s jednou skrytou vrstvou a kombinace definovaných množství neuronů skryté vrstvy. cze
dc.event 22nd International Conference on Process Control, PC 2019 (11.06.2019 - 14.06.2019, Štrbské Pleso) eng
dc.peerreviewed yes eng
dc.publicationstatus postprint eng
dc.identifier.doi 10.1109/PC.2019.8815057 eng
dc.project.ID SGS_2019_021/Výzkum pokročilých metod modelování, simulace, řízení, databázových systémů a webových aplikací eng
dc.identifier.obd 39883953 eng


Tento záznam se objevuje v následujících kolekcích

Zobrazit minimální záznam

Vyhledávání


Rozšířené hledání

Procházet

Můj účet