Page 1 of 1
강화학습 퀴즈 (07) 예측 문제
이름
*
편향-분산 교환에 대해 설명해보세요
*
몬테카를로 법이 분산이 큰 이유는 무엇입니까?
*
강화학습에서 시간차 학습의 핵심 아이디어를 설명해보세요
*
n-step TD와 TD(λ)에 대해 설명해보세요
*
적격 흔적(eligibility trace)에 대해 설명해보세요
*
편향 분산 교환과 시간차 학습, n-step TD와 TD(λ)에 어떤 관계가 있는지 설명해보세요.
*
Submit