「MARPO」アルゴリズムでは、行動の粒度に応じて異なるスタックを持つ。いかなる状態からでも、上位の行動に立ち戻ることができる

「MARPO」アルゴリズムでは、行動の粒度に応じて異なるスタックを持つ。いかなる状態からでも、上位の行動に立ち戻ることができる