1. 따로 노는 도구들의 비효율성많은 개발팀이 겪는 현실적인 모니터링 환경은 이렇습니다.Prometheus/Grafana를 보며 "어? CPU가 90%네?"라고 인지합니다.Kibana(ELK)를 켜서 해당 시간대의 에러 로그를 검색합니다.Jaeger를 켜서 그 시간대의 느린 요청을 따로 찾습니다.이 과정에서 시간을 낭비할 뿐만 아니라, "이 CPU 스파이크가 정확히 저 에러 로그와 관련된 게 맞나?"라는 확신을 갖기 어렵습니다. 우리는 이 사일로(Silo)를 무너뜨려야 합니다.2. Trace-Log Correlation: 로그에 트레이스 ID 심기가장 먼저 해야 할 일은 로그와 트레이싱을 연결하는 것입니다. 방법은 의외로 간단합니다. 모든 애플리케이션 로그에 현재 실행 중인 Trace ID와 Span I..