Page 1 of 1

[RL] 다른 방법들

이름

자연 선택을 모방한 최적화 방법은?

자연 선택을 모방한 최적화 방법은?
A
B
C
D

지도 학습을 이용해 전문가의 시연을 모방하는 방법은?

지도 학습을 이용해 전문가의 시연을 모방하는 방법은?
A
B
C
D

전문가의 시연에서 숨겨진 보상 함수를 추정하는 방법은?

전문가의 시연에서 숨겨진 보상 함수를 추정하는 방법은?
A
B
C
D

생성 AI의 행동과 사람의 행동을 구분하는 구분 AI를 만들고, 구분 AI가 구분하기 어렵게 생성 AI를 학습시켜는 방법은?

생성 AI의 행동과 사람의 행동을 구분하는 구분 AI를 만들고, 구분 AI가 구분하기 어렵게 생성 AI를 학습시켜는 방법은?
A
B
C
D