Prometheus는 강력하지만, 규모가 커지면 세 가지 벽에 부딪힙니다. 데이터 장기 보관의 한계, 단일 장애 지점(SPOF), 그리고 여러 클러스터를 한눈에 볼 수 없는 문제입니다. 오늘 마지막 시간에는 이 벽을 허물고 전 세계 어디서든 수만 개의 지표를 통합 관리할 수 있는 고가용성 설계를 알아봅니다.1. 왜 기본 Prometheus만으로는 부족한가?Vertical Scaling의 한계: 서버 한 대의 메모리와 CPU를 높이는 데는 한계가 있습니다.데이터 손실 위험: Prometheus 서버가 다운되면 그 기간의 데이터는 영원히 사라집니다.Global View 부재: A 클러스터와 B 클러스터의 데이터를 합쳐서 그래프를 그리고 싶어도 기본적으로는 불가능합니다.2. 해결사 1: Thanos (사이드카..