Page 1 of 1
[RL] Actor-Critic
이름
*
Actor-Critic에서 Actor의 역할은 무엇입니까?
*
Critic의 역할은 무엇입니까?
*
A3C와 A2C에서 다수의 워커가 있는 이유는 함수 근사의 어떤 문제를 해결하기 위한 것입니까?
*
A3C와 A2C에서 다수의 워커가 있는 이유는 함수 근사의 어떤 문제를 해결하기 위한 것입니까?
A
훈련의 불안정성
B
iid 가정의 위배
C
A, B 둘 다
D
A, B와 관련 없음
엔트로피 손실의 역할은 무엇입니까?
*
Generalized Advantage Estimation에서 편향을 늘리고 분산을 줄이려면 λ를 어떻게 하면 됩니까?
*
Generalized Advantage Estimation에서 편향을 늘리고 분산을 줄이려면 λ를 어떻게 하면 됩니까?
A
λ를 줄인다
B
λ를 늘린다
Submit