모방 강화학습

일반적인 강화학습에서 보상함수(인공지능 에이저트가 특정 상태에서 수행한 액션이 어떤 가치를 갖는가에 대한 정의) 정의가 어려운 경우, 전문가가 시연한 경험 데이터를 기반으로 학습하는 모델.1


Footnotes

  1. 쉽게 활용하는 인공지능 비즈니스, ai