[RL] 다른 방법들
지도 학습을 이용해 전문가의 시연을 모방하는 방법은?
*
지도 학습을 이용해 전문가의 시연을 모방하는 방법은?
전문가의 시연에서 숨겨진 보상 함수를 추정하는 방법은?
*
전문가의 시연에서 숨겨진 보상 함수를 추정하는 방법은?
생성 AI의 행동과 사람의 행동을 구분하는 구분 AI를 만들고, 구분 AI가 구분하기 어렵게 생성 AI를 학습시켜는 방법은?
*
생성 AI의 행동과 사람의 행동을 구분하는 구분 AI를 만들고, 구분 AI가 구분하기 어렵게 생성 AI를 학습시켜는 방법은?