Data Engineering 50
- [Embedded Data Stack] Day 5: Zero-ETL의 미래 - 대시보드 자체가 쿼리 엔진이 되는 아키텍처
- [Embedded Data Stack] Day 4: 엣지 컴퓨팅에서의 데이터 처리 - Cloudflare Workers와 가벼운 분석
- [Embedded Data Stack] Day 3: MotherDuck - 클라우드와 로컬의 하이브리드 실행(Hybrid Execution)
- [Embedded Data Stack] Day 2: WASM(WebAssembly)의 결합 - 브라우저 내에서 돌아가는 OLAP 엔진
- [Embedded Data Stack] Day 1: DuckDB - 왜 사람들은 '데이터 분석계의 SQLite'에 열광하는가
- [Beyond DAG] Day 5: 아키텍처 선택 가이드 - 단순 배치인가, 복잡한 상태 머신인가
- [Beyond DAG] Day 4: Event-driven Pipelines - 센서(Sensor)와 웹훅을 활용한 실시간 연동
- [Beyond DAG] Day 3: Temporal - 워크플로우 엔진의 끝판왕, 상태 저장 및 재시도 메커니즘
- [Beyond DAG] Day 2: Dagster - 데이터 자산(Software-defined Assets) 중심의 파이프라인 설계
- [Beyond DAG] Day 1: Airflow의 유산과 한계 - Imperative vs Declarative Orchestration
- [Data FinOps] Day 5: Unit Economics - 데이터 한 행을 처리하는 데 드는 비용 산출하기
- [Data FinOps] Day 4: FinOps 대시보드 구축 - dbt 메타데이터와 클라우드 빌링 데이터 통합
- [Data FinOps] Day 3: Storage Tiering 전략 - Iceberg와 S3 Intelligent-Tiering 결합하기
- [Data FinOps] Day 2: 쿼리 프로파일링 - 셔플(Shuffle)과 디스크 스필(Spill) 비용 계산
- [Data FinOps] Day 1: Snowflake & BigQuery 과금 모델 해부 - Slot과 Credits의 실체
- [Data Observability] Day 5: 데이터 가용성(SLO/SLA) 정의 - 데이터 팀의 성과를 수치화하는 법
- [Data Observability] Day 4: Monte Carlo vs Elementary - 엔터프라이즈급 관측 플랫폼 아키텍처
- [Data Observability] Day 3: 통계적 이상 탐지 - Z-Score에서 ML 기반 예측까지
- [Data Observability] Day 2: OpenLineage 표준 - 파이프라인 전반의 데이터 흐름 추적 기술
- [Data Observability] Day 1: Data Quality vs Observability - 정적 검증의 한계와 동적 관측
- [Modern Table Format] Day 5: 최종 비교 - 하둡의 유산에서 벗어난 클라우드 네이티브 스토리지 전략
- [Modern Table Format] Day 4: Catalog 전쟁 - Nessie와 REST Catalog가 지향하는 데이터 버전 관리
- [Modern Table Format] Day 3: Deletion Vectors와 Merge-on-Read - 쓰기 성능 최적화의 기술
- [Modern Table Format] Day 2: Apache Paimon - 스트리밍 처리에 특화된 LSM-tree 기반 테이블 포맷
- [Modern Table Format] Day 1: Apache Iceberg의 스냅샷 격리와 매니페스트 구조
- [Rust Wave] Day 5: Python 개발자를 위한 Rust, PyO3로 고성능 UDF 작성하기
- [Rust Wave] Day 4: 스트리밍의 새로운 강자, RisingWave vs Flink
- [Rust Wave] Day 3: 쿼리 엔진의 미래, DataFusion과 아키텍처의 모듈화
- [Rust Wave] Day 2: Spark 없이 Delta Lake 다루기, Delta-RS와 Python 바인딩
- [Rust Wave] Day 1: Pandas는 죽었다, Polars의 Lazy Evaluation과 메모리 모델
- [Databricks vs Snowflake] Day 5: NoSQL은 필요 없다, 반정형 데이터와 Variant
- [Databricks vs Snowflake] Day 4: Unity Catalog vs Horizon, 거버넌스와 데이터 공유의 미래
- [Databricks vs Snowflake] Day 3: SQL vs Python, 엔지니어링 생산성의 차이
- [Databricks vs Snowflake] Day 2: Micro-partitions vs Delta Lake, 스토리지와 비용의 상관관계
- [Databricks vs Snowflake] Day 1: 아키텍처의 기원과 Lakehouse로의 수렴
- [Snowflake 101] Day 5: NoSQL은 필요 없다, 반정형 데이터와 Variant
- [Snowflake 101] Day 4: 데이터 복제의 혁명, Zero-Copy Cloning
- [Snowflake 101] Day 3: 실수를 되돌리는 힘, Time Travel & Fail-safe
- [Snowflake 101] Day 2: 비용의 핵심, Virtual Warehouse 사이징 전략
- [Snowflake 101] Day 1: RDBMS와는 다르다, Snowflake 아키텍처의 비밀
- [dbt 101] Day 5: 문서화의 자동화, dbt Docs & Governance
- [dbt 101] Day 4: 오케스트레이션, Airflow와 dbt의 우아한 결합
- [dbt 101] Day 3: SQL의 한계를 넘어서, Jinja 매크로와 Test
- [dbt 101] Day 2: 모든 것은 연결된다, ref()와 Lineage
- [dbt 101] Day 1: ETL에서 ELT로, 그리고 dbt의 등장
- [Airflow 101] Day 5: 과거를 지배하는 자, Backfill & Best Practices
- [Airflow 101] Day 4: 외부 세계와의 연결, Provider & Connection (feat. Slack 알림)
- [Airflow 101] Day 3: 태스크 간의 대화법, XCom과 Jinja Template
- [Airflow 101] Day 2: Docker로 5분 만에 Airflow 띄우기 & 첫 DAG 작성
- [Airflow 101] Day 1: 워크플로우 자동화의 심장, Airflow란 무엇인가?