마르코프 결정 프로세스 순차적으로 행동을 결정해야 하는 문제를 풀기 위한 수학적 모델로, 상태, 행동, 상태 변환 확률, 보상 함수로 구성됨.1 Footnotes 쉽게 활용하는 인공지능 비즈니스 ↩