Page 1 of 1

[RL] 챗GPT

이름

언어 모형이란?

언어 모형으로 문장을 생성할 수 있는 이유는?

언어 모형에 강화학습이 필요한 이유는 무엇입니까?

RLHF는 무엇의 약자입니까?

DPO는 어떤 방법입니까?