모델 프리

강화학습은 최대 보상을 얻기 위한 행동을 배우는 것으로, 이때, 행동 결과에 따른 상태 변화와 보상을 정하는 것을 모델이라고 하며, 이러한 모델을 통해 학습하는 것을 모델 기반 학습이라는 것 대조하여, 이러한 모델 없이 반속적 시행착오를 통해 학습하는 것을 모델 프리 학습이라 함.¹ AI 모델이 유사한 입력에 대해 얼마나 일관적인 결과를 제공하는지를 이용하여 판단하는 특정으로 목적에 맞는 유사한 입력에 대해 정확도가 높을 경우 취약성이 낮다고 표현함.²