모방 강화학습 일반적인 강화학습에서 보상함수(인공지능 에이저트가 특정 상태에서 수행한 액션이 어떤 가치를 갖는가에 대한 정의) 정의가 어려운 경우, 전문가가 시연한 경험 데이터를 기반으로 학습하는 모델.1 Footnotes 쉽게 활용하는 인공지능 비즈니스, ai ↩