DQN이 등장하게된 배경 Q table로 해결하기 어려운 것 when the number of states is too large. → 계산하기가 매우 복잡해짐 위의 벽돌상태를 (깨진것, 안깨진것) 0,1로 표시하고 공의 위치를 0/1로 표시하면 너무 많은 조합이 있음 → 해결책 ) 이미지 자체를 input으로 사용하자. 단, 순간의 이미지를 캡쳐하므로 공의 방향을 알기 어려움 → 해결책 ) time-series 4개의 이미지를 연속해서 가져옴 하지만 또 너무 많은 조합 → DQN을 사용하자. DQN 정의: Q table을 함수화하여 input을 state로 정하고 output을 각 action에 대한 Q-value로 하는 것 Understanding DQN - supervised learning을 사용..