안녕하세요! 여러분의 아키텍처 길잡이, 팬돌프입니다.지난 5편에서 우리는 백엔드 API와 AI 에이전트를 넘어, 무거운 Spark와 Flink 데이터 파이프라인까지 K8s라는 거대한 통합 인프라 위에 안착시켰습니다. 이제 모든 서비스가 K8s 안에서 평화롭게 돌아가고 있습니다.그런데 어느 날, 회사 서비스가 유명 유튜버의 방송을 타면서 평소보다 100배 많은 트래픽이 쏟아져 들어오기 시작합니다. AI 에이전트의 응답은 느려지고, 3개 띄워둔 Pod의 CPU 사용률은 100%를 찍으며 서버가 비명을 지릅니다."빨리 Pod 개수를 3개에서 50개로 늘려!" 부랴부랴 YAML 파일을 수정해서 배포했지만, K8s는 "서버(Node)에 더 이상 남은 메모리와 CPU가 없어서 Pod를 띄울 수 없습니다(Pendin..