<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Joung,&#x20;Sunghun</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Seungryong</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Minsu</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Ig-Jae</dcvalue>
<dcvalue element="contributor" qualifier="author">Sohn,&#x20;Kwanghoon</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-12T04:08:41Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-12T04:08:41Z</dcvalue>
<dcvalue element="date" qualifier="created">2022-07-15</dcvalue>
<dcvalue element="date" qualifier="issued">2021-10</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;77784</dcvalue>
<dcvalue element="description" qualifier="abstract">We&#x20;propose&#x20;a&#x20;novel&#x20;framework&#x20;for&#x20;fine-grained&#x20;object&#x20;recognition&#x20;that&#x20;learns&#x20;to&#x20;recover&#x20;object&#x20;variation&#x20;in&#x20;3D&#x20;space&#x20;from&#x20;a&#x20;single&#x20;image,&#x20;trained&#x20;on&#x20;an&#x20;image&#x20;collection&#x20;without&#x20;using&#x20;any&#x20;ground-truth&#x20;3D&#x20;annotation.&#x20;We&#x20;accomplish&#x20;this&#x20;by&#x20;representing&#x20;an&#x20;object&#x20;as&#x20;a&#x20;composition&#x20;of&#x20;3D&#x20;shape&#x20;and&#x20;its&#x20;appearance,&#x20;while&#x20;eliminating&#x20;the&#x20;effect&#x20;of&#x20;camera&#x20;viewpoint,&#x20;in&#x20;a&#x20;canonical&#x20;configuration.&#x20;Unlike&#x20;conventional&#x20;methods&#x20;modeling&#x20;spatial&#x20;variation&#x20;in&#x20;2D&#x20;images&#x20;only,&#x20;our&#x20;method&#x20;is&#x20;capable&#x20;of&#x20;reconfiguring&#x20;the&#x20;appearance&#x20;feature&#x20;in&#x20;a&#x20;canonical&#x20;3D&#x20;space,&#x20;thus&#x20;enabling&#x20;the&#x20;subsequent&#x20;object&#x20;classifier&#x20;to&#x20;be&#x20;invariant&#x20;under&#x20;3D&#x20;geometric&#x20;variation.&#x20;Our&#x20;representation&#x20;also&#x20;allows&#x20;us&#x20;to&#x20;go&#x20;beyond&#x20;existing&#x20;methods,&#x20;by&#x20;incorporating&#x20;3D&#x20;shape&#x20;variation&#x20;as&#x20;an&#x20;additional&#x20;cue&#x20;for&#x20;object&#x20;recognition.&#x20;To&#x20;learn&#x20;the&#x20;model&#x20;without&#x20;ground-truth&#x20;3D&#x20;annotation,&#x20;we&#x20;deploy&#x20;a&#x20;differentiable&#x20;renderer&#x20;in&#x20;an&#x20;analysis-by-synthesis&#x20;framework.&#x20;By&#x20;incorporating&#x20;3D&#x20;shape&#x20;and&#x20;appearance&#x20;jointly&#x20;in&#x20;a&#x20;deep&#x20;representation,&#x20;our&#x20;method&#x20;learns&#x20;the&#x20;discriminative&#x20;representation&#x20;of&#x20;the&#x20;object&#x20;and&#x20;achieves&#x20;competitive&#x20;performance&#x20;on&#x20;fine-grained&#x20;image&#x20;recognition&#x20;and&#x20;vehicle&#x20;re-identification.&#x20;We&#x20;also&#x20;demonstrate&#x20;that&#x20;the&#x20;performance&#x20;of&#x20;3D&#x20;shape&#x20;reconstruction&#x20;is&#x20;improved&#x20;by&#x20;learning&#x20;fine-grained&#x20;shape&#x20;deformation&#x20;in&#x20;a&#x20;boosting&#x20;manner.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">IEEE</dcvalue>
<dcvalue element="title" qualifier="none">Learning&#x20;Canonical&#x20;3D&#x20;Object&#x20;Representation&#x20;for&#x20;Fine-Grained&#x20;Recognition</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1109&#x2F;ICCV48922.2021.00107</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">18th&#x20;IEEE&#x2F;CVF&#x20;International&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;(ICCV),&#x20;pp.1015&#x20;-&#x20;1025</dcvalue>
<dcvalue element="citation" qualifier="title">18th&#x20;IEEE&#x2F;CVF&#x20;International&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;(ICCV)</dcvalue>
<dcvalue element="citation" qualifier="startPage">1015</dcvalue>
<dcvalue element="citation" qualifier="endPage">1025</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">US</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">ELECTR&#x20;NETWORK</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2021-10-11</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">2021&#x20;IEEE&#x2F;CVF&#x20;INTERNATIONAL&#x20;CONFERENCE&#x20;ON&#x20;COMPUTER&#x20;VISION&#x20;(ICCV&#x20;2021)</dcvalue>
<dcvalue element="identifier" qualifier="wosid">000797698901020</dcvalue>
</dublin_core>
