Page 1 of 1
[RL] 몬테카를로
이름
*
정책 반복의 핵심 아이디어를 설명해보세요
*
가치 반복의 핵심 아이디어를 설명해보세요
*
강화학습에서 예측 문제란 무엇입니까?
*
몬테카를로법은 일반적으로 어떤 방법을 가리킵니까?
*
예측 문제에 몬테카를로법을 적용할 수 있는 이유는 무엇입니까?
*
Submit