Page 1 of 1
[RL] 제어 문제
이름
*
몬테카를로 제어의 핵심 아이디어를 설명해보세요
*
SARSA의 핵심 아이디어를 설명해보세요
*
On-Policy 제어와 Off-Policy 제어의 차이점은 무엇입니까?
*
Q 학습의 핵심 아이디어를 설명해보세요
*
이중 Q 학습은 Q 학습의 어떤 문제를 해결하려는 방법입니까?
*
Q(λ)를 구현하기 어려운 이유는 무엇입니까?
*
모형 기반 강화학습의 장점은 무엇입니까?
*
Trajectory Sampling을 하는 이유는 무엇입니까?
*
Submit