<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Minhyeok</dcvalue>
<dcvalue element="contributor" qualifier="author">Cho,&#x20;Suhwan</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Jungho</dcvalue>
<dcvalue element="contributor" qualifier="author">Yang,&#x20;Sunghun</dcvalue>
<dcvalue element="contributor" qualifier="author">Choi,&#x20;Heeseung</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Ig-Jae</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Sangyoun</dcvalue>
<dcvalue element="date" qualifier="accessioned">2025-12-30T02:00:52Z</dcvalue>
<dcvalue element="date" qualifier="available">2025-12-30T02:00:52Z</dcvalue>
<dcvalue element="date" qualifier="created">2025-11-25</dcvalue>
<dcvalue element="date" qualifier="issued">2025-06-10</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;153920</dcvalue>
<dcvalue element="description" qualifier="abstract">Open-vocabulary&#x20;semantic&#x20;segmentation&#x20;aims&#x20;to&#x20;assign&#x20;pixel-level&#x20;labels&#x20;to&#x20;images&#x20;across&#x20;an&#x20;unlimited&#x20;range&#x20;of&#x20;classes.&#x20;Traditional&#x20;methods&#x20;address&#x20;this&#x20;by&#x20;sequentially&#x20;connecting&#x20;a&#x20;powerful&#x20;mask&#x20;proposal&#x20;generator,&#x20;such&#x20;as&#x20;the&#x20;Segment&#x20;Anything&#x20;Model&#x20;(SAM),&#x20;with&#x20;a&#x20;pre-trained&#x20;vision-language&#x20;model&#x20;like&#x20;CLIP.&#x20;But&#x20;these&#x20;two-stage&#x20;approaches&#x20;often&#x20;suffer&#x20;from&#x20;high&#x20;computational&#x20;costs,&#x20;memory&#x20;inefficiencies.&#x20;In&#x20;this&#x20;paper,&#x20;we&#x20;propose&#x20;ESC-Net,&#x20;a&#x20;novel&#x20;one-stage&#x20;open-vocabulary&#x20;segmentation&#x20;model&#x20;that&#x20;leverages&#x20;the&#x20;SAM&#x20;decoder&#x20;blocks&#x20;for&#x20;class-agnostic&#x20;segmentation&#x20;within&#x20;an&#x20;efficient&#x20;inference&#x20;framework.&#x20;By&#x20;embedding&#x20;pseudo&#x20;prompts&#x20;generated&#x20;from&#x20;image-text&#x20;correlations&#x20;into&#x20;SAM’s&#x20;promptable&#x20;segmentation&#x20;framework,&#x20;ESC-Net&#x20;achieves&#x20;refined&#x20;spatial&#x20;aggregation&#x20;for&#x20;accurate&#x20;mask&#x20;predictions.&#x20;Additionally,&#x20;a&#x20;Vision-Language&#x20;Fusion&#x20;(VLF)&#x20;module&#x20;enhances&#x20;the&#x20;final&#x20;mask&#x20;prediction&#x20;through&#x20;image&#x20;and&#x20;text&#x20;guidance.&#x20;ESC-Net&#x20;and&#x20;PASCAL-Context,&#x20;outperforming&#x20;prior&#x20;methods&#x20;in&#x20;both&#x20;efficiency&#x20;and&#x20;accuracy.&#x20;Comprehensive&#x20;ablation&#x20;studies&#x20;further&#x20;demonstrate&#x20;its&#x20;robustness&#x20;across&#x20;challenging&#x20;conditions.</dcvalue>
<dcvalue element="publisher" qualifier="none">IEEE</dcvalue>
<dcvalue element="title" qualifier="none">Effective&#x20;SAM&#x20;Combination&#x20;for&#x20;Open-Vocabulary&#x20;Semantic&#x20;Segmentation</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1109&#x2F;cvpr52734.2025.02429</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">2025&#x20;IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR),&#x20;pp.26081&#x20;-&#x20;26090</dcvalue>
<dcvalue element="citation" qualifier="title">2025&#x20;IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR)</dcvalue>
<dcvalue element="citation" qualifier="startPage">26081</dcvalue>
<dcvalue element="citation" qualifier="endPage">26090</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">US</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">Nashville,&#x20;TN,&#x20;USA</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2025-06-10</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">2025&#x20;IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR)</dcvalue>
</dublin_core>
