Page 1 of 1

강화학습 퀴즈 (07) 예측 문제

이름

편향-분산 교환에 대해 설명해보세요

몬테카를로 법이 분산이 큰 이유는 무엇입니까?

강화학습에서 시간차 학습의 핵심 아이디어를 설명해보세요

n-step TD와 TD(λ)에 대해 설명해보세요

적격 흔적(eligibility trace)에 대해 설명해보세요

편향 분산 교환과 시간차 학습, n-step TD와 TD(λ)에 어떤 관계가 있는지 설명해보세요.