<?xml version="1.0" encoding="utf-8" standalone="no"?>
<dublin_core schema="dc">
<dcvalue element="contributor" qualifier="author">Lee,&#x20;Jin&#x20;hwi</dcvalue>
<dcvalue element="contributor" qualifier="author">Kang,&#x20;Seunghyun</dcvalue>
<dcvalue element="contributor" qualifier="author">Kim,&#x20;Chang&#x20;Hwan</dcvalue>
<dcvalue element="date" qualifier="accessioned">2024-01-12T02:45:37Z</dcvalue>
<dcvalue element="date" qualifier="available">2024-01-12T02:45:37Z</dcvalue>
<dcvalue element="date" qualifier="created">2023-11-30</dcvalue>
<dcvalue element="date" qualifier="issued">2023-07-24</dcvalue>
<dcvalue element="identifier" qualifier="uri">https:&#x2F;&#x2F;pubs.kist.re.kr&#x2F;handle&#x2F;201004&#x2F;76409</dcvalue>
<dcvalue element="description" qualifier="abstract">1&#x20;Introduction&#x0A;Bringing&#x20;an&#x20;object&#x20;to&#x20;people&#x20;is&#x20;an&#x20;essential&#x20;service&#x20;in&#x20;robot&#x20;manipulation.&#x20;A&#x20;robot&#x20;is&#x20;often&#x20;requested&#x20;to&#x20;plan&#x20;an&#x20;obstacle&#x20;rearrangement&#x20;task&#x20;and&#x20;execute&#x20;it&#x20;to&#x20;grasp&#x20;a&#x20;target&#x20;object&#x20;when&#x20;objects&#x20;are&#x20;placed&#x20;in&#x20;narrow&#x20;spaces,&#x20;such&#x20;as&#x20;cupboards,&#x20;refrigerators,&#x0A;and&#x20;shelves.&#x20;Figure&#x20;3&#x20;shows&#x20;an&#x20;example&#x20;environment&#x20;with&#x20;objects&#x20;on&#x20;the&#x20;shelf&#x20;and&#x20;a&#x20;mobile&#x20;manipulator.&#x20;The&#x20;robot&#x20;system&#x0A;has&#x20;a&#x20;multibody&#x20;system&#x20;as&#x20;a&#x20;combination&#x20;of&#x20;a&#x20;manipulator&#x20;with&#x20;multiple&#x20;DoF,&#x20;a&#x20;mobile&#x20;device,&#x20;and&#x20;a&#x20;vision&#x20;system.&#x20;In&#x20;such&#x0A;environments,&#x20;objects&#x20;could&#x20;be&#x20;grasped&#x20;from&#x20;the&#x20;side&#x20;or&#x20;front&#x20;because&#x20;the&#x20;boards&#x20;obstruct&#x20;the&#x20;manipulator&#x20;from&#x20;grasping&#x20;from&#x0A;the&#x20;top.&#x20;Especially&#x20;when&#x20;objects&#x20;stand&#x20;around&#x20;a&#x20;target&#x20;object&#x20;in&#x20;the&#x20;environment,&#x20;a&#x20;robot&#x20;must&#x20;move&#x20;obstacles&#x20;aside&#x20;and&#x20;grasp&#x20;the&#x0A;target&#x20;object.&#x20;In&#x20;this&#x20;kind&#x20;of&#x20;dense&#x20;environment,&#x20;a&#x20;task&#x20;and&#x20;motion&#x20;planner&#x20;should&#x20;determine&#x20;which&#x20;objects&#x20;to&#x20;move&#x20;and&#x20;where&#x0A;to&#x20;relocate&#x20;them&#x20;before&#x20;grasping&#x20;a&#x20;target.&#x0A;&#x0A;2&#x20;Method&#x0A;We&#x20;employ&#x20;one&#x20;of&#x20;the&#x20;actor-critic&#x20;methods&#x20;because&#x20;it&#x20;deals&#x20;with&#x20;the&#x20;continuous&#x20;action&#x20;space&#x20;by&#x20;learning&#x20;the&#x20;policy&#x20;itself,&#x20;not&#x0A;calculating&#x20;the&#x20;state&#x20;or&#x20;Q-value&#x20;function.&#x20;However,&#x20;such&#x20;a&#x20;value-based&#x20;method&#x20;as&#x20;DQN&#x20;evaluates&#x20;the&#x20;state&#x20;or&#x20;Q-value&#x20;function&#x0A;using&#x20;the&#x20;Bellman&#x20;equation,&#x20;which&#x20;is&#x20;hard&#x20;to&#x20;be&#x20;calculated&#x20;in&#x20;the&#x20;continuous&#x20;space.&#x20;In&#x20;our&#x20;problem,&#x20;we&#x20;apply&#x20;hybrid&#x20;Soft&#x0A;Actor-Critic&#x20;(hybrid&#x20;SAC)&#x20;in&#x20;[1]&#x20;to&#x20;simultaneously&#x20;consider&#x20;the&#x20;two&#x20;characteristics&#x20;of&#x20;the&#x20;object&#x20;rearrangement&#x20;task&#x20;and&#x20;motion&#x0A;planning&#x20;(OR-TAMP)&#x20;problem.&#x20;As&#x20;shown&#x20;in&#x20;Fig.&#x20;1,&#x20;the&#x20;actor&#x20;returns&#x20;the&#x20;mean&#x20;and&#x20;the&#x20;standard&#x20;deviation&#x20;from&#x20;a&#x20;state&#x20;s&#x20;identical&#x0A;to&#x20;the&#x20;standard&#x20;SAC&#x20;algorithm&#x20;in&#x20;[2].&#x20;The&#x20;actor&#x20;also&#x20;returns&#x20;a&#x20;discrete&#x20;value&#x20;by&#x20;sharing&#x20;the&#x20;hidden&#x20;layer,&#x20;which&#x20;is&#x20;different&#x20;from&#x0A;the&#x20;standard&#x20;SAC.&#x0A;&#x0A;3&#x20;Experiments&#x0A;We&#x20;compare&#x20;the&#x20;simulation&#x20;results&#x20;of&#x20;the&#x20;proposed&#x20;method&#x20;with&#x20;those&#x20;of&#x20;the&#x20;method&#x20;suggested&#x20;in&#x20;[3]&#x20;as&#x20;a&#x20;baseline.&#x20;For&#x20;comparing&#x0A;the&#x20;two&#x20;methods,&#x20;the&#x20;same&#x20;object&#x20;configurations&#x20;are&#x20;used,&#x20;and&#x20;the&#x20;outputs&#x20;from&#x20;both&#x20;methods&#x20;are&#x20;the&#x20;actions&#x20;of&#x20;rearrangement&#x0A;(i.e.,&#x20;which&#x20;obstacles&#x20;to&#x20;move&#x20;and&#x20;where&#x20;to&#x20;relocate&#x20;them).&#x20;We&#x20;perform&#x20;the&#x20;experiments&#x20;with&#x20;the&#x20;50&#x20;random&#x20;instances&#x20;for&#x20;each&#x20;of&#x0A;N&#x20;=&#x20;5,10,15,&#x20;where&#x20;N&#x20;is&#x20;the&#x20;number&#x20;of&#x20;objects.&#x20;The&#x20;results&#x20;are&#x20;shown&#x20;in&#x20;Fig.&#x20;2.&#x20;The&#x20;proposed&#x20;method&#x20;relocates&#x20;fewer&#x20;obstacles&#x0A;and&#x20;shows&#x20;higher&#x20;success&#x20;rates&#x20;than&#x20;the&#x20;baseline&#x20;method.&#x20;Especially&#x20;for&#x20;a&#x20;very&#x20;dense&#x20;environment&#x20;due&#x20;to&#x20;many&#x20;objects&#x20;in&#x20;a&#x20;fixed&#x0A;workspace,&#x20;the&#x20;baseline&#x20;method&#x20;may&#x20;often&#x20;fail&#x20;to&#x20;find&#x20;feasible&#x20;relocation&#x20;positions,&#x20;and&#x20;it&#x20;could&#x20;not&#x20;grasp&#x20;the&#x20;target&#x20;object&#x20;finally.&#x0A;&#x0A;4&#x20;Conclusions&#x0A;We&#x20;propose&#x20;a&#x20;reinforcement&#x20;learning&#x20;model&#x20;based&#x20;on&#x20;hybrid&#x20;SAC&#x20;to&#x20;deal&#x20;with&#x20;the&#x20;two&#x20;characteristics&#x20;of&#x20;the&#x20;OR-TAMP&#x20;problem:&#x0A;One&#x20;is&#x20;to&#x20;determine&#x20;which&#x20;obstacles&#x20;to&#x20;move&#x20;among&#x20;multiple&#x20;objects,&#x20;which&#x20;is&#x20;formulated&#x20;in&#x20;a&#x20;discrete&#x20;space,&#x20;and&#x20;another&#x20;is&#x0A;to&#x20;obtain&#x20;where&#x20;to&#x20;relocate&#x20;the&#x20;obstacles&#x20;in&#x20;the&#x20;continuous&#x20;workspace.&#x20;The&#x20;method&#x20;works&#x20;faster&#x20;than&#x20;the&#x20;baseline&#x20;and&#x20;plans&#x0A;more&#x20;feasible&#x20;actions.&#x20;We&#x20;observe&#x20;that&#x20;the&#x20;method&#x20;attempts&#x20;more&#x20;actions&#x20;for&#x20;rearrangement&#x20;in&#x20;denser&#x20;object&#x20;configurations&#x20;as&#x0A;expected.&#x20;The&#x20;actions&#x20;planned&#x20;by&#x20;the&#x20;method&#x20;are&#x20;executed&#x20;using&#x20;a&#x20;real&#x20;robot&#x20;within&#x20;acceptable&#x20;runtime.</dcvalue>
<dcvalue element="language" qualifier="none">English</dcvalue>
<dcvalue element="publisher" qualifier="none">ECCOMAS&#x20;Thematic&#x20;Conference&#x20;on&#x20;Multibody&#x20;Dynamics</dcvalue>
<dcvalue element="title" qualifier="none">Object&#x20;Rearrangement&#x20;in&#x20;Clutter&#x20;for&#x20;Mobile&#x20;Manipulator&#x20;Using&#x20;Hybrid&#x20;Soft&#x20;Actor-Critic&#x20;Method</dcvalue>
<dcvalue element="type" qualifier="none">Conference</dcvalue>
<dcvalue element="description" qualifier="journalClass">1</dcvalue>
<dcvalue element="identifier" qualifier="bibliographicCitation">11th&#x20;ECCOMAS&#x20;Thematic&#x20;Conference&#x20;on&#x20;Multibody&#x20;Dynamics</dcvalue>
<dcvalue element="citation" qualifier="title">11th&#x20;ECCOMAS&#x20;Thematic&#x20;Conference&#x20;on&#x20;Multibody&#x20;Dynamics</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">PO</dcvalue>
<dcvalue element="citation" qualifier="conferencePlace">Lisbon,&#x20;Portugal</dcvalue>
<dcvalue element="citation" qualifier="conferenceDate">2023-07-24</dcvalue>
<dcvalue element="relation" qualifier="isPartOf">Proceedings&#x20;of&#x20;ECCOMAS&#x20;Thematic&#x20;Conference&#x20;on&#x20;Multibody&#x20;Dynamics</dcvalue>
</dublin_core>
