Hye Jin Ryoo

[Rust Wave] Day 3: 쿼리 엔진의 미래, DataFusion과 아키텍처의 모듈화

서론: 데이터베이스 개발의 민주화 과거에 고성능 쿼리 엔진을 만든다는 것은 Oracle이나 Databricks 같은 거대 기술 기업의 전유물이었다. SQL 파서, 쿼리 옵티마이저, 실행 계획 수립, 스토리지 엔진 연동까지, 밑바닥부터 개발해야 하는 컴포넌트의 난이도가 극도로 높았기 때문이다. 하지만 Rust 생태계는 Apache Arrow Data...

Show GN: Show GN: Sandy - AI 에이전트가 매번 생각하는게 답답해서 만들었습니다

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 AI 에이전트에 산데비스탄을 달아줬습니다. 자동화 에이전트가 사람보다 느리면 의미가 있을까요? 🐢 기존 에이전트 Observe → L

몰트북 해킹: AI 소셜 네트워크에서 150만 개의 API 키 노출

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 AI 에이전트 전용 소셜 플랫폼 Moltbook의 데이터베이스가 잘못 구성되어, 150만 개의 API 인증 토큰과 3만5천 개의 이메일, 비공개 메...

TSA의 ‘신분증 없이 비행 시 45달러 수수료’는 불법

이 글은 GeekNews - 개발/기술/스타트업 뉴스 서비스 블로그에 게시된 글을 자동으로 가져온 것입니다. 더 자세한 내용과 원문은 아래 링크를 참고해 주세요. ➡️ 원문 보러 가기 원문 요약 미국 TSA(교통안전청) 이 REAL ID가 없는 승객에게 45달러 수수료를 부과하기 시작했으나, 현행 법률상 신분증 제시나 수수료 납부 의무는 없...

[Rust Wave] Day 2: Spark 없이 Delta Lake 다루기, Delta-RS와 Python 바인딩

서론: “작은 작업에 Spark는 너무 무겁다” Delta Lake는 ACID 트랜잭션, 타임 트래블, 스키마 검증을 제공하며 모던 데이터 플랫폼의 표준 스토리지 포맷으로 자리 잡았다. 하지만 지금까지 Delta Lake를 다루기 위한 유일한 입장권은 Apache Spark였다. 단순히 S3에 있는 1GB짜리 Delta 테이블을 읽거나, 몇 개의 ...

[Rust Wave] Day 1: Pandas는 죽었다, Polars의 Lazy Evaluation과 메모리 모델

서론: “RAM의 10배” 법칙의 종말 지난 10여 년간 Python 데이터 생태계에서 Pandas는 절대적인 지위를 누렸다. 하지만 데이터 엔지니어들에게는 암묵적인 룰이 있었다. “Pandas로 데이터를 처리하려면, 데이터 크기의 5배에서 10배에 달하는 RAM이 필요하다.” 이는 Pandas가 NumPy 기반으로 설계되었음에도 불구하고, 문자열...