<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Cho,&#x20;Suhwan</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Minhyeok</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Seunghoon</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Dogyoon</dcvalue>
<dcvalue element="contributor" qualifier="author">Choi,&#x20;Heeseung</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Ig-Jae</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Sangyoun</dcvalue>
<dcvalue element="date" qualifier="accessioned">2025-04-23T03:00:07Z</dcvalue>
<dcvalue element="date" qualifier="available">2025-04-23T03:00:07Z</dcvalue>
<dcvalue element="date" qualifier="created">2025-03-20</dcvalue>
<dcvalue element="date" qualifier="issued">2024-06</dcvalue>
<dcvalue element="identifier" qualifier="issn">1063-6919</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;152283</dcvalue>
<dcvalue element="description" qualifier="abstract">Unsupervised&#x20;video&#x20;object&#x20;segmentation&#x20;(VOS)&#x20;aims&#x20;to&#x20;detect&#x20;and&#x20;segment&#x20;the&#x20;most&#x20;salient&#x20;object&#x20;in&#x20;videos.&#x20;The&#x20;primary&#x20;techniques&#x20;used&#x20;in&#x20;unsupervised&#x20;VOS&#x20;are&#x20;1)&#x20;the&#x20;collaboration&#x20;of&#x20;appearance&#x20;and&#x20;motion&#x20;information;&#x20;and&#x20;2)&#x20;temporal&#x20;fusion&#x20;between&#x20;different&#x20;frames.&#x20;This&#x20;paper&#x20;proposes&#x20;two&#x20;novel&#x20;prototype-based&#x20;attention&#x20;mechanisms,&#x20;inter-modality&#x20;attention&#x20;(IMA)&#x20;and&#x20;inter-frame&#x20;attention&#x20;(IFA),&#x20;to&#x20;incorporate&#x20;these&#x20;techniques&#x20;via&#x20;dense&#x20;propagation&#x20;across&#x20;different&#x20;modalities&#x20;and&#x20;frames.&#x20;IMA&#x20;densely&#x20;integrates&#x20;context&#x20;information&#x20;from&#x20;different&#x20;modalities&#x20;based&#x20;on&#x20;a&#x20;mutual&#x20;refinement.&#x20;IFA&#x20;injects&#x20;global&#x20;context&#x20;of&#x20;a&#x20;video&#x20;to&#x20;the&#x20;query&#x20;frame,&#x20;enabling&#x20;a&#x20;full&#x20;utilization&#x20;of&#x20;useful&#x20;properties&#x20;from&#x20;multiple&#x20;frames.&#x20;Experimental&#x20;results&#x20;on&#x20;public&#x20;benchmark&#x20;datasets&#x20;demonstrate&#x20;that&#x20;our&#x20;proposed&#x20;approach&#x20;outperforms&#x20;all&#x20;existing&#x20;methods&#x20;by&#x20;a&#x20;substantial&#x20;margin.&#x20;The&#x20;proposed&#x20;two&#x20;components&#x20;are&#x20;also&#x20;thoroughly&#x20;validated&#x20;via&#x20;ablative&#x20;study.&#x20;Code&#x20;and&#x20;models&#x20;are&#x20;available&#x20;at&#x20;https:&#x2F;&#x2F;github.com&#x2F;Hydragon516&#x2F;DPA.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">IEEE&#x20;COMPUTER&#x20;SOC</dcvalue>
<dcvalue element="title" qualifier="none">Dual&#x20;Prototype&#x20;Attention&#x20;for&#x20;Unsupervised&#x20;Video&#x20;Object&#x20;Segmentation</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1109&#x2F;CVPR52733.2024.01820</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR),&#x20;pp.19238&#x20;-&#x20;19247</dcvalue>
<dcvalue element="citation" qualifier="title">IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR)</dcvalue>
<dcvalue element="citation" qualifier="startPage">19238</dcvalue>
<dcvalue element="citation" qualifier="endPage">19247</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">US</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">Seattle,&#x20;WA</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2024-06-16</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">2024&#x20;IEEE&#x2F;CVF&#x20;CONFERENCE&#x20;ON&#x20;COMPUTER&#x20;VISION&#x20;AND&#x20;PATTERN&#x20;RECOGNITION&#x20;(CVPR)</dcvalue>
<dcvalue element="identifier" qualifier="wosid">001342515502055</dcvalue>
<dcvalue element="identifier" qualifier="scopusid">2-s2.0-85201024586</dcvalue>
</dublin_core>
