안녕하세요! 여러분의 데이터 엔지니어링 멘토, 팬돌프입니다.지난 1편에서는 스파크가 왜 빅데이터 처리의 '게임 체인저'가 되었는지 이론적인 배경을 살펴보았습니다. "100배 빠르다"는 말에 가슴이 뛰셨나요?하지만 막상 스파크를 공부하려고 내 컴퓨터에 설치를 시도하다 보면, 그 설렘이 좌절로 바뀌는 경우가 많습니다. Java 버전을 맞추고, 환경 변수를 설정하고, 하둡 바이너리를 다운로드하는 과정이 '지옥의 문'처럼 느껴지기 때문이죠.그래서 오늘은 가장 깔끔하고, 가장 세련된 방법으로 단 5분 만에 내 로컬 PC에 완벽한 Spark 클러스터 환경을 구축하는 방법을 알려드리겠습니다. 바로 도커(Docker)를 이용해서 말이죠!1. 왜 Docker로 설치해야 하나요?과거에는 스파크를 공부하려면 리눅스 서버가 ..