[Embedded Data Stack] Day 1: DuckDB - 왜 사람들은 '데이터 분석계의 SQLite'에 열광하는가

Posted Mar 16, 2026

By Hye Jin Ryoo

3 min read

서론: 분석 엔진이 다시 로컬로 내려오고 있다

지난 10년은 데이터를 클라우드 웨어하우스로 모으는 시대였다. 하지만 모든 분석이 원격 클러스터를 필요로 하지는 않는다.

DuckDB가 주목받는 이유는 단순하다.

DuckDB는 서버 프로세스 운영 없이 애플리케이션 내부에 내장할 수 있다. 즉, “DB 서버 운영”이 아니라 “라이브러리 호출”로 시작할 수 있다.

OLAP 쿼리에 유리한 벡터화 실행 모델과 컬럼 지향 처리로, 분석성 집계에서 높은 효율을 낸다.

파일을 그대로 읽어 쿼리하는 패턴이 강력하다.

  
SELECT user_id, SUM(amount) AS total
FROM read_parquet('orders_2026_03.parquet')
GROUP BY user_id
ORDER BY total DESC
LIMIT 100;

공통점은 “운영 단순성”, 차이는 “워크로드 최적화 방향”이다.

DuckDB는 웨어하우스를 대체한다기보다, 다음 영역에서 비용/속도 이점을 준다.

Day 2에서는 DuckDB와 WASM(WebAssembly)의 결합을 다룬다. 브라우저 안에서 OLAP 쿼리가 어떻게 실행되는지 구조를 살펴본다.

This post is licensed under CC BY 4.0 by the author.