related : Model-based RL
Summary
env-dynamics에 대한 명시적 modeling 없이 agent model의 경험에만 의존하여 학습을 하는 방식.
대표적으로 Value-based method, Policy-based method, Actor-Critic(Value + Policy fusion) method 등이 존재.
related : Model-based RL
Summary
env-dynamics에 대한 명시적 modeling 없이 agent model의 경험에만 의존하여 학습을 하는 방식.
대표적으로 Value-based method, Policy-based method, Actor-Critic(Value + Policy fusion) method 등이 존재.