모델 프리
강화학습은 최대 보상을 얻기 위한 행동을 배우는 것으로, 이때, 행동 결과에 따른 상태 변화와 보상을 정하는 것을 모델이라고 하며, 이러한 모델을 통해 학습하는 것을 모델 기반 학습이라는 것 대조하여, 이러한 모델 없이 반속적 시행착오를 통해 학습하는 것을 모델 프리 학습이라 함.1 AI 모델이 유사한 입력에 대해 얼마나 일관적인 결과를 제공하는지를 이용하여 판단하는 특정으로 목적에 맞는 유사한 입력에 대해 정확도가 높을 경우 취약성이 낮다고 표현함.2