반응형

Spark 2

[Apache Iceberg] 8. [실전] Spark & Trino와 연동하여 레이크하우스 구축하기

안녕하세요! 여러분의 데이터 아키텍처 길잡이, 팬돌프입니다.드디어 Apache Iceberg 완전 정복 시리즈의 마지막 편에 도착했습니다. 지난 7편 동안 우리는 Iceberg의 철학부터 구조, 트랜잭션, 그리고 타임 트래블 같은 고급 기능까지 깊이 있게 파헤쳤습니다. 이론적인 무장은 이제 완벽합니다.하지만 구슬이 서 말이라도 꿰어야 보배겠죠? 오늘은 이 강력한 기술을 여러분의 현업 시스템에 실제로 적용하는 방법을 다룹니다.데이터 가공(ETL)의 제왕 Apache Spark, 그리고 초고속 대화형 쿼리의 강자 Trino(구 PrestoSQL). 이 두 엔진을 Iceberg와 연결하여 진정한 데이터 레이크하우스를 구축하는 설정법과, 운영자가 반드시 챙겨야 할 유지보수 루틴까지 꽉 채워 담았습니다.대장정의 ..

[Airflow] 9. 실전 프로젝트 - 엔드투엔드 데이터 플랫폼 구축

안녕하세요, 데이터로 세상을 설계하는 위대한 건축가 여러분! 대장정의 마지막 여정에 오신 것을 환영합니다. 저는 여러분의 영원한 데이터 탐험 동반자, 팬돌프입니다. 🐧지난 8편에 걸쳐 우리는 Airflow의 가장 기초적인 개념부터 시작하여, 복잡한 파이프라인을 설계하고, 클라우드 네이티브 환경에서 안정적으로 운영하는 전문가 수준의 지식까지, 정말 길고도 알찬 여정을 함께했습니다. 이제는 흩어져 있던 모든 구슬을 꿰어 보배로 만들 시간입니다.오늘은 지금까지 배운 모든 이론과 기술을 총동원하여, 실제 비즈니스 가치를 창출하는 엔드투엔드(End-to-End) 데이터 플랫폼을 직접 구축해보는 최종 실전 프로젝트를 진행하겠습니다. 이론을 넘어 실제를 경험하는 이 마지막 장을 통해, 여러분은 진정한 데이터 플랫폼..

반응형