<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Park,&#x20;Jungin</dcvalue>
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Jiyoung</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Ig-Jae</dcvalue>
<dcvalue element="contributor" qualifier="author">Sohn,&#x20;Kwanghoon</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-12T03:41:47Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-12T03:41:47Z</dcvalue>
<dcvalue element="date" qualifier="created">2023-01-13</dcvalue>
<dcvalue element="date" qualifier="issued">2022-06</dcvalue>
<dcvalue element="identifier" qualifier="issn">1063-6919</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;77185</dcvalue>
<dcvalue element="description" qualifier="abstract">This&#x20;paper&#x20;presents&#x20;Probabilistic&#x20;Video&#x20;Contrastive&#x20;Learning,&#x20;a&#x20;self-supervised&#x20;representation&#x20;learning&#x20;method&#x20;that&#x20;bridges&#x20;contrastive&#x20;learning&#x20;with&#x20;probabilistic&#x20;representation.&#x20;We&#x20;hypothesize&#x20;that&#x20;the&#x20;clips&#x20;composing&#x20;the&#x20;video&#x20;have&#x20;different&#x20;distributions&#x20;in&#x20;short-term&#x20;duration,&#x20;but&#x20;can&#x20;represent&#x20;the&#x20;complicated&#x20;and&#x20;sophisticated&#x20;video&#x20;distribution&#x20;through&#x20;combination&#x20;in&#x20;a&#x20;common&#x20;embedding&#x20;space.&#x20;Thus,&#x20;the&#x20;proposed&#x20;method&#x20;represents&#x20;video&#x20;clips&#x20;as&#x20;normal&#x20;distributions&#x20;and&#x20;combines&#x20;them&#x20;into&#x20;a&#x20;Mixture&#x20;of&#x20;Gaussians&#x20;to&#x20;model&#x20;the&#x20;whole&#x20;video&#x20;distribution.&#x20;By&#x20;sampling&#x20;embeddings&#x20;from&#x20;the&#x20;whole&#x20;video&#x20;distribution,&#x20;we&#x20;can&#x20;circumvent&#x20;the&#x20;careful&#x20;sampling&#x20;strategy&#x20;or&#x20;transformations&#x20;to&#x20;generate&#x20;augmented&#x20;views&#x20;of&#x20;the&#x20;clips,&#x20;unlike&#x20;previous&#x20;deterministic&#x20;methods&#x20;that&#x20;have&#x20;mainly&#x20;focused&#x20;on&#x20;such&#x20;sample&#x20;generation&#x20;strategies&#x20;for&#x20;contrastive&#x20;learning.&#x20;We&#x20;further&#x20;propose&#x20;a&#x20;stochastic&#x20;contrastive&#x20;loss&#x20;to&#x20;learn&#x20;proper&#x20;video&#x20;distributions&#x20;and&#x20;handle&#x20;the&#x20;inherent&#x20;uncertainty&#x20;from&#x20;the&#x20;nature&#x20;of&#x20;the&#x20;raw&#x20;video.&#x20;Experimental&#x20;results&#x20;verify&#x20;that&#x20;our&#x20;probabilistic&#x20;embedding&#x20;stands&#x20;as&#x20;a&#x20;state-of-the-art&#x20;video&#x20;representation&#x20;learning&#x20;for&#x20;action&#x20;recognition&#x20;and&#x20;video&#x20;retrieval&#x20;on&#x20;the&#x20;most&#x20;popular&#x20;benchmarks,&#x20;including&#x20;UCF101&#x20;and&#x20;HMDB51.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">IEEE&#x20;COMPUTER&#x20;SOC</dcvalue>
<dcvalue element="title" qualifier="none">Probabilistic&#x20;Representations&#x20;for&#x20;Video&#x20;Contrastive&#x20;Learning</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="identifier" qualifier="doi">10.1109&#x2F;CVPR52688.2022.01430</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR),&#x20;pp.14691&#x20;-&#x20;14701</dcvalue>
<dcvalue element="citation" qualifier="title">IEEE&#x2F;CVF&#x20;Conference&#x20;on&#x20;Computer&#x20;Vision&#x20;and&#x20;Pattern&#x20;Recognition&#x20;(CVPR)</dcvalue>
<dcvalue element="citation" qualifier="startPage">14691</dcvalue>
<dcvalue element="citation" qualifier="endPage">14701</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">US</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">New&#x20;Orleans,&#x20;LA</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2022-06-18</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">2022&#x20;IEEE&#x2F;CVF&#x20;CONFERENCE&#x20;ON&#x20;COMPUTER&#x20;VISION&#x20;AND&#x20;PATTERN&#x20;RECOGNITION&#x20;(CVPR&#x20;2022)</dcvalue>
<dcvalue element="identifier" qualifier="wosid">000870783000028</dcvalue>
<dcvalue element="identifier" qualifier="scopusid">2-s2.0-85141646491</dcvalue>
</dublin_core>
