강화학습이란: Agent가 특정 environment에서 reward를 많이 쌓을 수 있는 방향으로 action을 취하는 것 (방법을 알려주는 것은 강화학습이 아님) → 방법을 알려주지 않으므로 초기에 불필요한 학습 과정이 많아짐 → 우연에 의해서 random action을 취하게 되고 그 때 reward를 얻게됨 강화학습이 잘 적용되는 분야 반복적으로 작업할 수 있는 것들 - 바둑 - 자율주행 (강화학습 뿐만 아니라, 세팅값들에의해서 같이 조절됨) 너무 가까워 지면 멈추라는 세팅값들이 존재함 강화학습이 잘 적용되지 않는 분야 변동성이 많은 것 - 주식 - 로또번호 예측 강화학습 알고리즘 Basic 1) The agent interacts with the environment by performing a..