Page 1 of 1

[RL] 제어 문제

이름

몬테카를로 제어의 핵심 아이디어를 설명해보세요

SARSA의 핵심 아이디어를 설명해보세요

On-Policy 제어와 Off-Policy 제어의 차이점은 무엇입니까?

Q 학습의 핵심 아이디어를 설명해보세요

이중 Q 학습은 Q 학습의 어떤 문제를 해결하려는 방법입니까?

Q(λ)를 구현하기 어려운 이유는 무엇입니까?

모형 기반 강화학습의 장점은 무엇입니까?

Trajectory Sampling을 하는 이유는 무엇입니까?