<aside> ✅

Banach Fixed-Point Theorem은 완비 거리 공간에서 수축사상이면 유일한 고정점이 존재하고 반복적용으로 기하급수적으로 수렴한다고 말하는 정리입니다. RL에서 Value Iteration의 수렴성을 이 정리로 증명할 수 있습니다.

</aside>

image.png

비공식 설명


해석


강화학습과의 연관