<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Woojeong</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Suhyun</dcvalue>
<dcvalue element="contributor" qualifier="author">Park,&#x20;Mincheol</dcvalue>
<dcvalue element="contributor" qualifier="author">Jeon,&#x20;Geonseok</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-12T04:08:47Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-12T04:08:47Z</dcvalue>
<dcvalue element="date" qualifier="created">2023-11-26</dcvalue>
<dcvalue element="date" qualifier="issued">2020-12</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;77789</dcvalue>
<dcvalue element="description" qualifier="abstract">Network&#x20;pruning&#x20;is&#x20;widely&#x20;used&#x20;to&#x20;lighten&#x20;and&#x20;accelerate&#x20;neural&#x20;network&#x20;models.&#x20;Structured&#x20;network&#x20;pruning&#x20;discards&#x20;the&#x20;whole&#x20;neuron&#x20;or&#x20;filter,&#x20;leading&#x20;to&#x20;accuracy&#x20;loss.&#x20;In&#x20;this&#x20;work,&#x20;we&#x20;propose&#x20;a&#x20;novel&#x20;concept&#x20;of&#x20;neuron&#x20;merging&#x20;applicable&#x20;to&#x20;both&#x20;fully&#x20;connected&#x20;layers&#x20;and&#x20;convolution&#x20;layers,&#x20;which&#x20;compensates&#x20;for&#x20;the&#x20;information&#x20;loss&#x20;due&#x20;to&#x20;the&#x20;pruned&#x20;neurons&#x2F;filters.&#x20;Neuron&#x20;merging&#x20;starts&#x20;with&#x20;decomposing&#x20;the&#x20;original&#x20;weights&#x20;into&#x20;two&#x20;matrices&#x2F;tensors.&#x20;One&#x20;of&#x20;them&#x20;becomes&#x20;the&#x20;new&#x20;weights&#x20;for&#x20;the&#x20;current&#x20;layer,&#x20;and&#x20;the&#x20;other&#x20;is&#x20;what&#x20;we&#x20;name&#x20;a&#x20;scaling&#x20;matrix,&#x20;guiding&#x20;the&#x20;combination&#x20;of&#x20;neurons.&#x20;If&#x20;the&#x20;activation&#x20;function&#x20;is&#x20;ReLU,&#x20;the&#x20;scaling&#x20;matrix&#x20;can&#x20;be&#x20;absorbed&#x20;into&#x20;the&#x20;next&#x20;layer&#x20;under&#x20;certain&#x20;conditions,&#x20;compensating&#x20;for&#x20;the&#x20;removed&#x20;neurons.&#x20;We&#x20;also&#x20;propose&#x20;a&#x20;data-free&#x20;and&#x20;inexpensive&#x20;method&#x20;to&#x20;decompose&#x20;the&#x20;weights&#x20;by&#x20;utilizing&#x20;the&#x20;cosine&#x20;similarity&#x20;between&#x20;neurons.&#x20;Compared&#x20;to&#x20;the&#x20;pruned&#x20;model&#x20;with&#x20;the&#x20;same&#x20;topology,&#x20;our&#x20;merged&#x20;model&#x20;better&#x20;preserves&#x20;the&#x20;output&#x20;feature&#x20;map&#x20;of&#x20;the&#x20;original&#x20;model;&#x20;thus,&#x20;it&#x20;maintains&#x20;the&#x20;accuracy&#x20;after&#x20;pruning&#x20;without&#x20;fine-tuning.&#x20;We&#x20;demonstrate&#x20;the&#x20;effectiveness&#x20;of&#x20;our&#x20;approach&#x20;over&#x20;network&#x20;pruning&#x20;for&#x20;various&#x20;model&#x20;architectures&#x20;and&#x20;datasets.&#x20;As&#x20;an&#x20;example,&#x20;for&#x20;VGG-16&#x20;on&#x20;CIFAR-10,&#x20;we&#x20;achieve&#x20;an&#x20;accuracy&#x20;of&#x20;93.16%&#x20;while&#x20;reducing&#x20;64%&#x20;of&#x20;total&#x20;parameters,&#x20;without&#x20;any&#x20;fine-tuning.&#x20;The&#x20;code&#x20;can&#x20;be&#x20;found&#x20;here:&#x20;https:&#x2F;&#x2F;github.com&#x2F;friendshipkim&#x2F;neuron-merging.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">Neural&#x20;information&#x20;processing&#x20;systems&#x20;foundation</dcvalue>
<dcvalue element="title" qualifier="none">Neuron&#x20;merging:&#x20;Compensating&#x20;for&#x20;pruned&#x20;neurons</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">34th&#x20;Conference&#x20;on&#x20;Neural&#x20;Information&#x20;Processing&#x20;Systems,&#x20;NeurIPS&#x20;2020</dcvalue>
<dcvalue element="citation" qualifier="title">34th&#x20;Conference&#x20;on&#x20;Neural&#x20;Information&#x20;Processing&#x20;Systems,&#x20;NeurIPS&#x20;2020</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">US</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">Online</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2020-12-06</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">Advances&#x20;in&#x20;Neural&#x20;Information&#x20;Processing&#x20;Systems</dcvalue>
</dublin_core>
