<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Minjae&#x20;Kim</dcvalue>
<dcvalue element="contributor" qualifier="author">Sangyoon&#x20;Yu</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Suhyun</dcvalue>
<dcvalue element="contributor" qualifier="author">Soo-Mook&#x20;Moon</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-12T02:46:37Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-12T02:46:37Z</dcvalue>
<dcvalue element="date" qualifier="created">2023-11-26</dcvalue>
<dcvalue element="date" qualifier="issued">2023-05</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;76459</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;iclr.cc&#x2F;virtual&#x2F;2023&#x2F;poster&#x2F;11878</dcvalue>
<dcvalue element="description" qualifier="abstract">Federated&#x20;learning&#x20;is&#x20;for&#x20;training&#x20;a&#x20;global&#x20;model&#x20;without&#x20;collecting&#x20;private&#x20;local&#x20;data&#x20;from&#x20;clients.&#x20;As&#x20;they&#x20;repeatedly&#x20;need&#x20;to&#x20;upload&#x20;locally-updated&#x20;weights&#x20;or&#x20;gradients&#x20;instead,&#x20;clients&#x20;require&#x20;both&#x20;computation&#x20;and&#x20;communication&#x20;resources&#x20;enough&#x20;to&#x20;participate&#x20;in&#x20;learning,&#x20;but&#x20;in&#x20;reality&#x20;their&#x20;resources&#x20;are&#x20;heterogeneous.&#x20;To&#x20;enable&#x20;resource-constrained&#x20;clients&#x20;to&#x20;train&#x20;smaller&#x20;local&#x20;models,&#x20;width&#x20;scaling&#x20;techniques&#x20;have&#x20;been&#x20;used,&#x20;which&#x20;reduces&#x20;the&#x20;channels&#x20;of&#x20;a&#x20;global&#x20;model.&#x20;Unfortunately,&#x20;width&#x20;scaling&#x20;suffers&#x20;from&#x20;heterogeneity&#x20;of&#x20;local&#x20;models&#x20;when&#x20;averaging&#x20;them,&#x20;leading&#x20;to&#x20;a&#x20;lower&#x20;accuracy&#x20;than&#x20;when&#x20;simply&#x20;excluding&#x20;resource-constrained&#x20;clients&#x20;from&#x20;training.&#x20;This&#x20;paper&#x20;proposes&#x20;a&#x20;new&#x20;approach&#x20;based&#x20;on&#x20;depth&#x20;scaling&#x20;called&#x20;DepthFL.&#x20;DepthFL&#x20;defines&#x20;local&#x20;models&#x20;of&#x20;different&#x20;depths&#x20;by&#x20;pruning&#x20;the&#x20;deepest&#x20;layers&#x20;off&#x20;the&#x20;global&#x20;model,&#x20;and&#x20;allocates&#x20;them&#x20;to&#x20;clients&#x20;depending&#x20;on&#x20;their&#x20;available&#x20;resources.&#x20;Since&#x20;many&#x20;clients&#x20;do&#x20;not&#x20;have&#x20;enough&#x20;resources&#x20;to&#x20;train&#x20;deep&#x20;local&#x20;models,&#x20;this&#x20;would&#x20;make&#x20;deep&#x20;layers&#x20;partially-trained&#x20;with&#x20;insufficient&#x20;data,&#x20;unlike&#x20;shallow&#x20;layers&#x20;that&#x20;are&#x20;fully&#x20;trained.&#x20;DepthFL&#x20;alleviates&#x20;this&#x20;problem&#x20;by&#x20;mutual&#x20;self-distillation&#x20;of&#x20;knowledge&#x20;among&#x20;the&#x20;classifiers&#x20;of&#x20;various&#x20;depths&#x20;within&#x20;a&#x20;local&#x20;model.&#x20;Our&#x20;experiments&#x20;show&#x20;that&#x20;depth-scaled&#x20;local&#x20;models&#x20;build&#x20;a&#x20;global&#x20;model&#x20;better&#x20;than&#x20;width-scaled&#x20;ones,&#x20;and&#x20;that&#x20;self-distillation&#x20;is&#x20;highly&#x20;effective&#x20;in&#x20;training&#x20;data-insufficient&#x20;deep&#x20;layers.</dcvalue>
<dcvalue element="publisher" qualifier="none">ICLR</dcvalue>
<dcvalue element="title" qualifier="none">DepthFL&#x20;:&#x20;Depthwise&#x20;Federated&#x20;Learning&#x20;for&#x20;Heterogeneous&#x20;Clients</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">The&#x20;Eleventh&#x20;International&#x20;Conference&#x20;on&#x20;Learning&#x20;Representations</dcvalue>
<dcvalue element="citation" qualifier="title">The&#x20;Eleventh&#x20;International&#x20;Conference&#x20;on&#x20;Learning&#x20;Representations</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">RW</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">Kigali&#x20;Rwanda</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2023-05-01</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">The&#x20;Eleventh&#x20;International&#x20;Conference&#x20;on&#x20;Learning&#x20;Representations</dcvalue>
</dublin_core>
